本书逐步介绍了shell脚本如何帮助健康和生活专家解决日常工作中软件依赖最小的许多数据处理任务。书中给出的示例显示了如何使用简单的命令行工具并将它们组合起来从Web资源中检索数据和文本、过滤和挖掘文献,以及探索生物医学本体中编码的语义。为了存储数据,本书依赖于开放的标准文本文件格式,如TSV、CSV、XML和OWL,任何文本编辑器或电子表格应用程序都可以打开这些格式。前两章,简介和参考资料,简要介绍了shell脚本,并描述了健康和生命科学中的流行数据资源。第三章,数据检索,首先介绍了一个涉及多种数据资源的常见数据处理任务。然后,本章通过逐个介绍所需的命令行工具来说明如何自动化该任务的每个步骤。第四章,文本处理,展示了如何使用简单的字符串匹配技术和正则表达式来过滤和分析文本。最后一章,语义处理,展示了XPath查询和shell脚本是如何处理复杂数据的,比如用于指定本体的图。除了在40多年的时间里几乎是不可改变的,并且在我们的大多数个人计算机中都可以使用之外,健康和生活专家学习shell脚本相对容易,它是一组独立的命令序列。理解它们就像通过测试和理解其程序步骤和变量,并结合它们的中间结果来执行一个新的实验室方案。因此,这本书对想要轻松学习如何处理数据和文本的健康和生活专家或学生特别相关,而这反过来可能促进和激励他们在未来获得更深层次的生物信息学技能。