新智元报道
来源:Google
编辑:鹏飞
一图胜千言。可视化是阅读并理解实验结果非常有效的手段之一。用过TensorFlow不能不知道一个叫做TensorBoard的可视化工具包,它能够帮助科研人员监视指标,可视化模型,ML程序分析,可视化超参数调整实验等。
不过,可视化只是简化工作的一个步骤而已。我们知道,很多机器学习实验都不是单枪匹马能够完成的,往往涉及到多人协作。如果是在一个实验室或者办公室,大家可以聚集在一个电脑屏幕上看可视化结果即可。然而,很多情况下也会涉及到远程协作。
这个时候,人们没办法像Google Docs那样方便的进行协同合作,通常只能通过截屏或者录屏,效率低下,而且也很难捕获所有详细信息。
极具共享精神的Google,怎么可以容忍这种事情发生呢?于是就有了TensorBoard.dev。
TensorBoard.dev是一项托管服务,可以为用户轻松地进行免费的托管、跟踪和共享机器学习实验。你需要做的,只是上传你的TensorBoard日志,之后会获得一个分享链接。
任何人都可以通过该链接查看实验结果,而无需进行任何安装或设置。目前该功能还处在预览阶段。
这款新工具除了可以在线直接查看结果外,Google的开发人员也希望通过TensorBoard.dev更多的功能,例如在“使用统一的文本到文本Transfer探索迁移学习的限制”一文探讨了使用文本到文本模型和一些任务的最新结果的NLP迁移学习。下面这个TensorBoard.dev示例显示了“预训练数据集”的基线训练结果:
TensorFlow Models存储库的BERT模型预训练任务:
TensorFlow.js强化学习示例包括指向相应TensorBoard的链接:
第一步是确定你要共享的TensorBoard日志。请注意,你上传的TensorBoard是公开的,因此请勿上传敏感数据。
确保TensorBoard是最新版:
pip install -U tensorboard
之后
tensorboard dev upload --logdir {logs}
按照说明使用你的Google帐户进行身份验证之后,将在TensorBoard.dev中提供链接。你甚至可以在上传过程中立即查看TensorBoard。上传程序将继续运行并上传出现在日志目录中的新日志,直到你停止该过程为止。
每个人都可以打开TensorBoard.dev链接,因此可以随时使用它,在GitHub或Stack Overflow上提供建议或直接跟踪实验而无需在本地打开TensorBoard。需要一个Google帐户来上传日志,但不需要查看TensorBoard。
其他几个命令可用于列出,删除或导出实验。你可以使用tensorboard dev-help命令了解更多信息。当前,每个用户最多只能有1000万个数据点,超出后上传会报错。
你可以在此处找到在Colab中运行的端到端教程:
https://colab.research.google.com/github/tensorflow/tensorboard/blob/master/docs/tbdev_getting_started.ipynb
虽然教程显示了如何使用通过Keras的.fit()创建的TensorBoard日志,但是你可以使用通过基于GradientTape的训练循环创建的日志(如TensorBoard的Scalars教程中所示)或任何其他有效的TensorBoard日志。
TensorBoard.dev正在预览中,当前仅包含TensorBoard的Scalars仪表板。我们将增加TensorBoard的更多功能,并扩展共享功能。我们正在探索一些想法,以使发现已发布的有趣TensorBoards更容易。