成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
0
这一届科研计算人赶DDL红宝书
2021 年 11 月 16 日
学术头条
问:实验室的硬件条件好坏对你的科研有多大影响?
答:啥条件都行,没有影响。
我们坚信以下三点:
1、科学家就是专门负责搞科研的;
2、不依赖别人,你的研究效率和节奏必须掌握在你自己手里;
3、不管是尝试有风险的新颖项目,还是运用深度学习手段,科研多试错才能出好东西。
有老师跟我们吐槽说,一天天地忙着维护环境,整得跟运维工程师一样了,太耽误事儿。想找学生帮忙吧,他们很多也不懂啊~
老师们的硕博后们也苦不堪言,本专业要学的东西已经多到爆炸,又要理论还要搞实验,还要学大量计算机专业知识……
你这边数据刚拿到手,别人文章都发了……救救孩子吧。
守着大把机器的,不见得有恃无恐;
得不到的,永远在骚动,甚至还会掉头发。。。
我们为
这一届科研计算人准备的赶DDL红宝书
分为上下两篇
,有兴趣可以扫描二维码添加小F微信(ID:imfastone)获取:
《学生篇》
一、你们具体怎么帮我们搞科研的?展开说说
二、在云上和在本地跑任务有什么区别?
三、我自己也会上云,为啥要选你们?
四、你们跟超算比怎么样,有区别吗?
《老师篇》
五、我是一个老师,你们对我的科研工作/团队管理有什么帮助?
六、我是药物/生物/化学专业方向的,你们能做到什么程度?
七、我是集成电路/微电子专业
方向
的,
你们能做到什么程度?
八、我是力学/热能/机械工程专业
方向
的,
你们能做到什么程度?
你想问的,这里都有答案。
你想要的,我们能提供更多。
先来看看下面这些效果:
这样跑COMSOL,是不是就可以发Nature了
Auto-Scale这支仙女棒如何大幅提升Virtuoso仿真效率?
1分钟告诉你用MOE模拟200000个分子要花多少钱
LS-DYNA求解效率深度测评 │ 六种规模,本地VS云端5种不同硬件配置
揭秘20000个VCS任务背后的“搬桌子”系列故事
155个GPU!多云场景下的Amber自由能计算
怎么把需要45天的突发性Fluent仿真计算缩短到4天之内?
国内最大规模OPC上云,5000核并行,效率提升53倍
提速2920倍!用AutoDock Vina对接2800万个分子
从4天到1.75小时,如何让Bladed仿真效率提升55倍?
从30天到17小时,如何让HSPICE仿真效率提升42倍?
以下是学生篇精华摘要
你们面向的是哪些科研方向的人?
四大类:
集成电路/微电子专业方向
,包括物理电子学/电路与系统/微电子学与固体电子学等专业;
药物/生物/化学专业方向
,包括生物化学与分子生物学/化学工程/生物化学/生物工程/药物化学/分析化学/高分子化学与物理等专业;
力学/热能/机械工程专业方向
,包括流体力学/工程力学/机械制造及其自动化/车辆工程/工程热物理/热能工程/动力机械及工程/流体机械及工程/航空宇航制造工程等专业;
以及高校或科研机构的AI训练平台、虚拟仿真实验室
等等。
你们是怎么帮助我们这些搞科研的人的?
两点结论:
1、让大家更专心做科研,提升高校及科研机构师生的整体科研效率,让IT能力跟上科研能力。
2、避免大家因为资源不够而不得不选择短平快的研究,不敢尝试。
具体分成以下四个维度:
一整套针对应用优化的自动化科研环境,即开即用;
海量资源加智能决策辅助,大幅提升计算效率同时降低成本;
有针对老师需求的独特场景(这一点后续单独展开);
让IT能力跟上科研能力,可视化操作,轻松上手。
有时候为了抢几台机器都要跟实验室的师兄弟姐妹斗智斗勇,你们的资源真有那么多?
云上资源非常多,我们曾经根据IDC报告推测国内云厂商的服务器总量超过116万台,2020年中国公有云服务市场的全球占比为6.5%,可大致估算出全球公有云厂商的服务器总量超过千万台。
重点是,这些机器都是可用资源。
之前上过云,发现有些类型的资源比较少(如部分型号的GPU),需要分别从几个不同云厂商调资源,你们支持吗?
我们支持多云。
多云指使用来自多个云厂商的多种服务,可以最大限度利用不同云厂商的不同优势,就像你说的从几个不同云厂商调资源。而在产品价格、地域选择,多云也更有优势。
多机并行跑任务真的特别快吗?
云端的一大特点,就是你用相同的钱,可以让1台机器跑100小时,也可以让100台机器跑1小时,后者就是多机并行,能够大大节省跑任务的时间。
我们实验室里才几台机器,天天维护头就很大了,云上这么多机器还不得把自己搞秃了?
云上的运行环境都是自动化配置的,不需要人工干预,用户还可以通过平台进行统一管理和监控,方便易操作。
举个例子,我们的Auto-Scale功能可以自动监控用户提交的任务数量和资源的需求,动态按需地开启和关闭所需算力资源,在不够的时候,还能根据不同的用户策略,自动化调度本区域及其他区域的目标类型或相似类型实例资源。
所有操作都是自动化完成,无需用户干预。
下图就是开启Auto-Scale功能后,用户某项目一周之内所调用云端计算资源的动态情况。
其中橙色曲线为OD实例的使用状况,红色曲线为SPOT的使用状况。
可以看到整个阶段算力波峰为约3500核,而波谷只有650核左右。Auto-Scale功能可以根据任务运算情况动态开启云端资源,并在波峰过去后自动关闭,让资源的使用随着用户的需求自动扩张及缩小,最大程度匹配任务需求。
任务跑得怎么样可以在平台上监控吗?
提交任务后,可以在监控界面中查看任务和集群运行情况。
我们也可以在界面上查看任务运行的日志。
我们还支持实时查看任务本身的状态,比如Fluent的残差曲线,监控计算的收敛情况。
老师想搞深度学习,需要很多GPU,但有时候云上连几块GPU都很难抢到,怎么办?
一般来说单家云厂商的GPU可用资源是比较有限的,我们曾经在一个任务中成功地调用了155块NVIDIA Tesla V100,单个公有云厂商单区域资源未必能够随时满足这种需求。这里面就还涉及到跨云调度。
具体可以看《
生信云实证Vol.6:155个GPU!多云场景下的Amber自由能计算
》
我试过自己抢云厂商的SPOT,虽然确实很便宜,但非常难用,随时会断掉,你们对SPOT支持到什么程度?
由于SPOT一定会被抢走,我们的建议是用SPOT去算那些单个任务小总数却很多的东西。
比如生物/化学计算里的分子对接。常规分子对接任务几分钟即可算完,特别适合SPOT这种分分钟可能被抢走的状态。而且我们平台
具备自动重试功能,一个任务被中断可以自动重新提交,任务之间互相不影响,重新提交单个任务影响很小
。
不太懂IT,看到Linux就束手无策,我还能用你们这个云平台吗?
可以的,我们支持Windows系统。
另外,由于分布式计算场景大部分基于Linux系统,我们可为用户提供图形化界面,基本不改变操作习惯,通过简单的鼠标操作就可以跑任务,上手非常快。
我们学校的超算中心总是在用好多年前的旧机器,非常慢,实验室的情况稍微好一点,你们云上有新硬件吗?
你在云上随时可以用到最新的硬件。
举个例子,2019年4月3日上午,Intel在太平洋两岸近乎同步发布了代号Cascade Lake的第二代至强可扩展处理器。当天中午12点,国内某云厂商便宣布其基于Cascade Lake的全新一代通用计算增强型云服务器C6正式转为商用。
超算就要慢得多了,超算中心从规划设计到正式上线需要经历若干年的时间,能够在上线时配置当年上市的硬件已经是其规划能力的最佳体现,其最新硬件更新周期至少要以年为单位。
超算资源有时候跑着跑着就被强制回收了,你们也会有这种情况吗?
我们提供的是独占资源,不会被抢走。
我们之前用超算都是共享资源,不能改,也不能自己装一些组件,你们可以吗?
我们提供的是独占资源,用户拥有管理员权限,安装什么、如何使用均由用户自己做主。
你们支持哪些应用?
药物/生物/化学方向的有
Autodock Vina、NetMHC、Qvina、Amber、MaterialsStudio、GATK、VASP、Rosetta、Schrödinger、BCFtools、Gromacs、FastQC、DeltaVina、Gaussian
等;
集成电路/微电子方向的有
Innovus、Spectre、Genus、Dracula、Virtuoso、Ncsim、PowerSI、Xcelium、PT、DC、VCS、VC、FM、Verdi、OPC Proteus、Tmax2、HSPICE、Spyglass、Starrc、Calibre、Tessent、nmLVS、nmDRC、xACT、xL、xRC
等;
力学/热能/机械工程方向的有
Abaqus、Autodesk、Bladed、CFX、COMSOL、Fluent、HyperWorks、LS-DYNA、Matlab、Mechanical、MSC Adams、MSC Nastran、StarCCM、SOLIDWORKS、VASP、WRF
等;
人工智能方向的有
Pytorch、Mxnet、Tensorflow、Caffe2、Miniconda、Scikit Learn/OpenCV、Pylearn2、Keras
等。
你们和这些软件/工具,有什么区别呢?
一句话概括,我们是EDA/CAE/CFD/生物/化学/AI计算云平台,通过我们可以在短时间内调集海量资源,为上述软件/工具加速,从而抢在各种科研deadline之前跑完任务,拿到结果。
关于我们的其他优势与技术能力,可以通过后面的问题了解。
……
完整版
《这一届科研计算人赶DDL红宝书:学生篇/老师篇》
请扫描二维码添加小F微信(ID:imfastone)获取。
-
END
-
我们有个
科研计算云平台
集成多种科研应用,大量任务多节点并行
应对短时间爆发性需求,连网即用
跑任务快,原来几个月甚至几年,现在只需几小时
5分钟快速上手,拖拉点选可视化界面,无需代码
支持高级用户直接在云端创建集群
扫码免费试用,送300元体验金,入股不亏~
更多电子书
欢迎扫码关注小F(ID:imfastone)获取
你也许想了解具体的
落地场景:
这样跑COMSOL,是不是就可以发Nature了
Auto-Scale这支仙女棒如何大幅提升Virtuoso仿真效率?
1分钟告诉你用MOE模拟200000个分子要花多少钱
LS-DYNA求解效率深度测评 │ 六种规模,本地VS云端5种不同硬件配置
揭秘20000个VCS任务背后的“搬桌子”系列故事
155个GPU!多云场景下的Amber自由能计算
怎么把需要45天的突发性Fluent仿真计算缩短到4天之内?
国内最大规模OPC上云,5000核并行,效率提升53倍
提速2920倍!用AutoDock Vina对接2800万个分子
从4天到1.75小时,如何让Bladed仿真效率提升55倍?
从30天到17小时,如何让HSPICE仿真效率提升42倍?
关于为应用定义的云平台
:
缺人!缺钱!赶时间!初创IC设计公司如何“绝地求生”?
杨洋组织的“太空营救”中, 那2小时到底发生了什么?
一次搞懂速石科技三大产品:FCC、FCC-E、FCP
AI太笨了……暂时
速石科技成三星Foundry国内首家SAFE™云合作伙伴
Ansys最新CAE调研报告找到阻碍仿真效率提升的“元凶”
【2021版】全球44家顶尖药企AI辅助药物研发行动白皮书
国内超算发展近40年,终于遇到了一个像样的对手
帮助CXO解惑上云成本的迷思,看这篇就够了
花费4小时5500美元,速石科技跻身全球超算TOP500
登录查看更多
点赞并收藏
0
暂时没有读者
0
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
缩放
关注
0
【ICLR2022】MIT最新论文《用于分子生成的数据高效图文法学习》,用图文法生成新分子,Data-Efficient Graph Grammar Learning for Molecular Generation
专知会员服务
13+阅读 · 2022年4月10日
2022最新发表《绿色碳科学:双碳目标下的科学基础 ——第 292 期“双清论坛”学术综述》
专知会员服务
17+阅读 · 2022年2月12日
《中文机器阅读理解》教程,哈工大讯飞联合实验室主管研究员崔一鸣
专知会员服务
35+阅读 · 2021年11月11日
约束进化算法及其应用研究综述
专知会员服务
29+阅读 · 2021年4月12日
一份硬核计算机科学CS自学修炼计划
专知会员服务
43+阅读 · 2021年1月12日
机器直觉
专知会员服务
26+阅读 · 2020年11月22日
沈向洋博士:科研七个坑,我的“求之不得”职业生涯之感悟
专知会员服务
35+阅读 · 2020年11月17日
【高能所】如何做好⼀份学术报告& 简单介绍LaTeX 的使用
专知会员服务
92+阅读 · 2020年5月16日
【BAAI 北京智源大会】类脑神经形态智能芯片,蔡一茂 / 北京大学教授,智源研究员
专知会员服务
15+阅读 · 2019年11月19日
【CCF优秀博士学位论文奖-2019】大规模图数据处理系统的设计与实现,清华大学朱晓伟
专知会员服务
50+阅读 · 2019年11月8日
科研实习 | 北大贺笛老师招收GNN方向科研实习生
图与推荐
0+阅读 · 2022年3月25日
星跃重洋 | 刘国栋:非典型理工男在微软亚洲研究院的科研“旅”记
微软研究院AI头条
0+阅读 · 2022年3月24日
科研实习 | 清华大学交叉信息研究院弋力老师招收三维视觉科研实习生
PaperWeekly
1+阅读 · 2022年2月16日
科研工作者的你,每天有多努力?
极市平台
0+阅读 · 2022年2月8日
提高科研能力!牛津大佬带飞!
CVer
1+阅读 · 2022年1月14日
读博那些事儿:如何对抗压力?在国内深造还是选择出国?
微软研究院AI头条
0+阅读 · 2021年11月10日
我在斯坦福做科研的碎碎念
夕小瑶的卖萌屋
1+阅读 · 2021年9月1日
给实验室配台NVIDIA DGX,快来学习下怎么选择
机器之心
2+阅读 · 2021年4月22日
入行量化,你必须知道的几点
深度学习与NLP
12+阅读 · 2019年3月5日
智能电网环境下地理分布式互联网数据中心的能量成本降低方法研究
国家自然科学基金
0+阅读 · 2015年12月31日
脉冲星计时阵列中连续引力波探测和估计的研究
国家自然科学基金
0+阅读 · 2015年12月31日
柔性布拉格反射层的声学特性研究
国家自然科学基金
0+阅读 · 2014年12月31日
基于GPU的脉冲星宽带观测的相干消色散研究
国家自然科学基金
0+阅读 · 2013年12月31日
以电力-天然气-热能为核心的微能源网分层优化控制策略研究
国家自然科学基金
0+阅读 · 2013年12月31日
介孔氧化硅/半芳香聚酰胺纳米复合反渗透膜的设计合成及脱盐机理研究
国家自然科学基金
0+阅读 · 2013年12月31日
基于多酸的无酶生物传感器的构建及应用研究
国家自然科学基金
0+阅读 · 2012年12月31日
以生物质碳为原料制备石墨烯复合材料的研究
国家自然科学基金
1+阅读 · 2012年12月31日
地震波传播与成像保持效率的高精度算法的研究
国家自然科学基金
0+阅读 · 2012年12月31日
含稀土卤化物物质体系热力学参数计算优化
国家自然科学基金
0+阅读 · 2009年12月31日
Efficient and Accurate Adaptive Resolution for Weakly-Compressible SPH
Arxiv
0+阅读 · 2022年4月19日
The signature and cusp geometry of hyperbolic knots
Arxiv
0+阅读 · 2022年4月19日
Learning Disentangled Representations in the Imaging Domain
Arxiv
0+阅读 · 2022年4月17日
A Survey on Location-Driven Influence Maximization
Arxiv
0+阅读 · 2022年4月17日
Learning to Accelerate by the Methods of Step-size Planning
Arxiv
1+阅读 · 2022年4月15日
A Survey on the Explainability of Supervised Machine Learning
Arxiv
24+阅读 · 2020年11月16日
Machine Reasoning Explainability
Arxiv
14+阅读 · 2020年9月1日
Optimization Models for Machine Learning: A Survey
Arxiv
18+阅读 · 2019年1月16日
Meta-Learning: A Survey
Arxiv
136+阅读 · 2018年10月8日
Attention Is All You Need
Arxiv
27+阅读 · 2017年12月6日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
缩放
自由能
运维工程师
GPU
生物
自动化
相关VIP内容
【ICLR2022】MIT最新论文《用于分子生成的数据高效图文法学习》,用图文法生成新分子,Data-Efficient Graph Grammar Learning for Molecular Generation
专知会员服务
13+阅读 · 2022年4月10日
2022最新发表《绿色碳科学:双碳目标下的科学基础 ——第 292 期“双清论坛”学术综述》
专知会员服务
17+阅读 · 2022年2月12日
《中文机器阅读理解》教程,哈工大讯飞联合实验室主管研究员崔一鸣
专知会员服务
35+阅读 · 2021年11月11日
约束进化算法及其应用研究综述
专知会员服务
29+阅读 · 2021年4月12日
一份硬核计算机科学CS自学修炼计划
专知会员服务
43+阅读 · 2021年1月12日
机器直觉
专知会员服务
26+阅读 · 2020年11月22日
沈向洋博士:科研七个坑,我的“求之不得”职业生涯之感悟
专知会员服务
35+阅读 · 2020年11月17日
【高能所】如何做好⼀份学术报告& 简单介绍LaTeX 的使用
专知会员服务
92+阅读 · 2020年5月16日
【BAAI 北京智源大会】类脑神经形态智能芯片,蔡一茂 / 北京大学教授,智源研究员
专知会员服务
15+阅读 · 2019年11月19日
【CCF优秀博士学位论文奖-2019】大规模图数据处理系统的设计与实现,清华大学朱晓伟
专知会员服务
50+阅读 · 2019年11月8日
热门VIP内容
开通专知VIP会员 享更多权益服务
OpenAI十二天总结与Agent新范式
【伯克利博士论文】高效深度学习推理的全栈方法
【AAAI2025】多层次最优传输用于语言模型中的通用跨标记器知识蒸馏
大规模语言模型增强推荐系统:分类、趋势、应用与未来
相关资讯
科研实习 | 北大贺笛老师招收GNN方向科研实习生
图与推荐
0+阅读 · 2022年3月25日
星跃重洋 | 刘国栋:非典型理工男在微软亚洲研究院的科研“旅”记
微软研究院AI头条
0+阅读 · 2022年3月24日
科研实习 | 清华大学交叉信息研究院弋力老师招收三维视觉科研实习生
PaperWeekly
1+阅读 · 2022年2月16日
科研工作者的你,每天有多努力?
极市平台
0+阅读 · 2022年2月8日
提高科研能力!牛津大佬带飞!
CVer
1+阅读 · 2022年1月14日
读博那些事儿:如何对抗压力?在国内深造还是选择出国?
微软研究院AI头条
0+阅读 · 2021年11月10日
我在斯坦福做科研的碎碎念
夕小瑶的卖萌屋
1+阅读 · 2021年9月1日
给实验室配台NVIDIA DGX,快来学习下怎么选择
机器之心
2+阅读 · 2021年4月22日
入行量化,你必须知道的几点
深度学习与NLP
12+阅读 · 2019年3月5日
相关基金
智能电网环境下地理分布式互联网数据中心的能量成本降低方法研究
国家自然科学基金
0+阅读 · 2015年12月31日
脉冲星计时阵列中连续引力波探测和估计的研究
国家自然科学基金
0+阅读 · 2015年12月31日
柔性布拉格反射层的声学特性研究
国家自然科学基金
0+阅读 · 2014年12月31日
基于GPU的脉冲星宽带观测的相干消色散研究
国家自然科学基金
0+阅读 · 2013年12月31日
以电力-天然气-热能为核心的微能源网分层优化控制策略研究
国家自然科学基金
0+阅读 · 2013年12月31日
介孔氧化硅/半芳香聚酰胺纳米复合反渗透膜的设计合成及脱盐机理研究
国家自然科学基金
0+阅读 · 2013年12月31日
基于多酸的无酶生物传感器的构建及应用研究
国家自然科学基金
0+阅读 · 2012年12月31日
以生物质碳为原料制备石墨烯复合材料的研究
国家自然科学基金
1+阅读 · 2012年12月31日
地震波传播与成像保持效率的高精度算法的研究
国家自然科学基金
0+阅读 · 2012年12月31日
含稀土卤化物物质体系热力学参数计算优化
国家自然科学基金
0+阅读 · 2009年12月31日
相关论文
Efficient and Accurate Adaptive Resolution for Weakly-Compressible SPH
Arxiv
0+阅读 · 2022年4月19日
The signature and cusp geometry of hyperbolic knots
Arxiv
0+阅读 · 2022年4月19日
Learning Disentangled Representations in the Imaging Domain
Arxiv
0+阅读 · 2022年4月17日
A Survey on Location-Driven Influence Maximization
Arxiv
0+阅读 · 2022年4月17日
Learning to Accelerate by the Methods of Step-size Planning
Arxiv
1+阅读 · 2022年4月15日
A Survey on the Explainability of Supervised Machine Learning
Arxiv
24+阅读 · 2020年11月16日
Machine Reasoning Explainability
Arxiv
14+阅读 · 2020年9月1日
Optimization Models for Machine Learning: A Survey
Arxiv
18+阅读 · 2019年1月16日
Meta-Learning: A Survey
Arxiv
136+阅读 · 2018年10月8日
Attention Is All You Need
Arxiv
27+阅读 · 2017年12月6日
大家都在搜
palantir
无人艇
大规模语言模型
CMU博士论文
数字孪生
洛克菲勒
自主可控
抗生素使用
联合试验
出海产品从 0 到 1 该怎么做
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top