近日,TensorFlow 官网上发布了许多令人兴奋的新文档,包括对模型修复、模型并行以及 TensorFlow Lite(https://www.tensorflow.org/lite)和 TensorFlow Model Garden(https://github.com/tensorflow/models)的更新。一起来看看你能收获哪些新东西吧!
模型修复:反事实的Logit配对(CLP)
TensorFlow 的人工智能团队增加了一个新的模型修复技术,作为其模型修复库的一部分。TensorFlow 模型修复库提供了训练时的技术来干预模型,如通过引入或改变模型目标来改变模型本身。最初推出的第一个模型修复技术:MinDiff,它使两个数据片之间的性能差异最小。而此次的新技术是反事实Logit配对(CLP,Counterfactual Logit Pairing)。这项技术可以确保当一个例子中引用的敏感属性被删除或替换时,模型的预测不会发生变化。例如,在一个毒性分类器中,诸如 "我是一个男人 "和 "我是一个女同性恋 "这样的例子应该是相等的,不会被归类为毒性。
基本教程:https://www.tensorflow.org/responsible_ai/model_remediation/counterfactual/guide/counterfactual_usage_steps
Keras教程:https://www.tensorflow.org/responsible_ai/model_remediation/counterfactual/guide/counterfactual_keras
API参考:https://www.tensorflow.org/responsible_ai/model_remediation/api_docs/python/model_remediation/counterfactual
模型并行:DTensor
DTensor 提供了一个全局编程模型,允许开发者在全球范围内对张量进行操作,同时管理跨设备的分布。DTensor 通过一个名为“单程序多数据”(SPMD)扩展的程序,根据分片指令分配程序和张力器。
通过将整个应用程序与分片指令解耦,DTensor 可以在单个设备、多个设备、甚至多个客户端上运行同一个应用程序,同时保留其全局语义。如果你还记得 TensorFlow1.0 中的 Mesh TensorFlow,DTensor 可以解决 Mesh 能解决的同样问题:训练模型可能大于单核。
TensorFlow 2.9 会将一直在夜间构建的 DTensor 在 tensorflow.org 上公开。尽管 DTensor 是实验性的,但欢迎你去尝试。
DTensor 指南:https://www.tensorflow.org/guide/dtensor_overview
DTensor Keras 教程:https://www.tensorflow.org/tutorials/distribute/dtensor_keras_tutorial
API 参考:https://www.tensorflow.org/api_docs/python/tf/keras/dtensor
TensorFlow Lite的新功能
TensorFlow Lite 网站做了一些重大改动,包括入门文档。
构建开发者成长之路
首先,TensorFlow 现在按平台(Android,iOS 和其他设备)来给开发人员提供学习指南,使得开发人员能更容易在相应设备上运行 TensorFlow 模型。TensorFlow 不仅为 Android 用户增加了新的学习路线图和快速入门指南,更早些时候,Google Play 服务中的 TensorFlow Lite 的新测试版也增加了一个指南。这些快速入门指南包括 Kotlin 和 Java 中的例子,并将例子代码升级到了 CameraX。
模型制作者
TensorFlow Lite Model Maker 库简化了使用自定义数据集训练 TensorFlow Lite 模型的过程。它使用转移学习来减少所需的训练数据量并减少训练时间,并预置了七个常见的任务,包括图像分类,物体检测和文本搜索。
TensorFlow 为文本搜索增加了一个新的教程(https://www.tensorflow.org/lite/models/modify/model_maker/text_searcher)。这种类型的模型可以让你接受一个文本查询,并在文本数据集中搜索出最相关的条目,如网页数据库。在移动设备上,你可以将其用于自动回复或语义文件搜索。
此外,TensorFlow 还发布了完整的 Python 库参考(https://www.tensorflow.org/lite/api_docs/python/tflite_model_maker)。
TensorFlow Lite 模型页面
为用例找到正确的模型有时会令人抓狂。TensorFlow 写了更多关于如何为你的任务选择正确模型的指导(https://www.tensorflow.org/lite/models),以及做出这个决定需要考虑的因素。你也可以在这里找到常见用例的模型链接。
TensorFlow Model Garden:最先进的模型准备就绪
TensorFlow Model Garden(https://www.tensorflow.org/guide/model_garden) 为视觉和自然语言处理(NLP)提供了许多最先进的机器学习(ML)模型的实现,以及工作流程工具,让你在标准数据集上快速配置和运行这些模型。Model Garden涵盖了视觉和文本任务,以及一个名为 Orbit 的灵活的训练循环库。模型带有预建的配置来训练到最先进的水平,以及许多有用的专门操作。
TensorFlow 将开始记录你用 Model Garden 所做的各种各样的伟大事业,由此开启的第一站应该从了解 Model Garden 的概览、可用模型的清单和图像分类教程开始。
Model Garden 的概览:https://www.tensorflow.org/guide/model_garden
可用模型的清单:https://github.com/tensorflow/models/tree/master/official
图像分类教程:https://www.tensorflow.org/tutorials/images/classification_with_model_garden
其他令人兴奋的新变化
此外,谷歌与 CSIRO 合作,利用 TensorFlow 代码库加强对大堡礁上有害物种的监测工作。通过 Kaggle 竞赛,机器学习开发者合作训练 ML 模型,以识别使珊瑚礁生态系统退化的棘冠海星的爆发。以此来保护大堡礁的后代。
还有一个新变化是关于 TensorFlow 压缩的新教程(https://www.tensorflow.org/tutorials/generative/data_compression),它使用神经网络进行有损压缩。这个例子使用类似自动编码器的东西来压缩和解压 MNIST。
图源TensorFlow官网
以上的更新中,有哪些惊艳到你了呢?欢迎各位一起交流~
参考资料:https://blog.tensorflow.org/2022/06/new-documentation-on-tensorfloworg.html
— 推荐阅读 —
《新程序员001-004》已全面上市
欢迎扫描下方二维码或点击进入立即订阅
一键三连 「分享」「点赞」「在看」
成就一亿技术人