【干货书】健康和生命科学的数据文本处理，107页pdf

本书逐步介绍了shell脚本如何帮助健康和生活专家解决日常工作中软件依赖最小的许多数据处理任务。书中给出的示例显示了如何使用简单的命令行工具并将它们组合起来从Web资源中检索数据和文本、过滤和挖掘文献，以及探索生物医学本体中编码的语义。为了存储数据，本书依赖于开放的标准文本文件格式，如TSV、CSV、XML和OWL，任何文本编辑器或电子表格应用程序都可以打开这些格式。前两章，简介和参考资料，简要介绍了shell脚本，并描述了健康和生命科学中的流行数据资源。第三章，数据检索，首先介绍了一个涉及多种数据资源的常见数据处理任务。然后，本章通过逐个介绍所需的命令行工具来说明如何自动化该任务的每个步骤。第四章，文本处理，展示了如何使用简单的字符串匹配技术和正则表达式来过滤和分析文本。最后一章，语义处理，展示了XPath查询和shell脚本是如何处理复杂数据的，比如用于指定本体的图。除了在40多年的时间里几乎是不可改变的，并且在我们的大多数个人计算机中都可以使用之外，健康和生活专家学习shell脚本相对容易，它是一组独立的命令序列。理解它们就像通过测试和理解其程序步骤和变量，并结合它们的中间结果来执行一个新的实验室方案。因此，这本书对想要轻松学习如何处理数据和文本的健康和生活专家或学生特别相关，而这反过来可能促进和激励他们在未来获得更深层次的生物信息学技能。

https://library.oapen.org/handle/20.500.12657/22825

成为VIP会员查看完整内容

相关内容

健康

关注 0

健康是指一个人在身体、精神和社会等方面都处于良好的状态。健康包括两个方面的内容：

一是主要脏器无疾病，身体形态发育良好，体形均匀，人体各系统具有良好的生理功能，有较强的身体活动能力和劳动能力，这是对健康最基本的要求；

二是对疾病的抵抗能力较强，能够适应环境变化，各种生理刺激以及致病因素对身体的作用。传统的健康观是“无病即健康”，现代人的健康观是整体健康，世界卫生组织提出“健康不仅是躯体没有疾病，还要具备心理健康、社会适应良好和有道德”。因此，现代人的健康内容包括：躯体健康、心理健康、心灵健康、社会健康、智力健康、道德健康、环境健康等。健康是人的基本权利。健康是人生的第一财富。

【干货书】Python编程实战导论，263页pdf

专知会员服务

71+阅读 · 2021年7月10日

【干货书】数据科学手册，456页pdf

专知会员服务

151+阅读 · 2021年4月27日

【干货书】管理统计和数据科学原理，678页pdf

专知会员服务

186+阅读 · 2020年7月29日

【干货书】现代数据平台架构，636页pdf

专知会员服务

260+阅读 · 2020年6月15日