成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
内存
关注
0
综合
百科
VIP
热门
动态
论文
精华
让你的类ChatGPT千亿大模型提速省钱15倍,微软开源 DeepSpeed-Chat
CSDN
4+阅读 · 2023年4月13日
有哪些省内存的大语言模型训练/微调/推理方法?
PaperWeekly
1+阅读 · 2023年4月9日
基于重排序的新量化方法RPTQ:实现大型语言模型的 3 比特量化
机器之心
3+阅读 · 2023年4月9日
【斯坦福博士论文】面向行业级神经推荐的数据驱动统计分片,110页pdf
专知
3+阅读 · 2023年4月6日
100亿参数的语言模型跑不动?MIT华人博士提出SmoothQuant量化,内存需求直降一半,速度提升1.56倍!
新智元
0+阅读 · 2022年11月30日
为什么要用 Tair 来服务低延时场景 - 从购物车升级说起
阿里技术
0+阅读 · 2022年11月24日
查询性能显著提升,Apache Doris 向量化版本在小米 A/B 实验场景的调优实践
CSDN
0+阅读 · 2022年11月23日
“我让 AI 来处理我 24 小时的音频信息——这会是未来吗?”
CSDN
0+阅读 · 2022年11月21日
Go程序提速42%,只需改变一个字符
量子位
0+阅读 · 2022年11月20日
一文详解|从JDK8飞升到JDK17,再到未来的JDK21
阿里技术
1+阅读 · 2022年11月18日
字节跳动提出 KVM 内核热升级方案,效率提升 5.25 倍
InfoQ
0+阅读 · 2022年11月16日
美国国家安全局督促弃用 C/C++,使用更安全的 Rust、C# 等!
CSDN
0+阅读 · 2022年11月15日
Rust:香是真的香,不同学习者却各有各的难 | 极客时间
InfoQ
0+阅读 · 2022年11月15日
我们这群90后,正在字节跳动“死磕”Linux内核 | 卓越技术团队访谈录
InfoQ
1+阅读 · 2022年11月14日
Java 近期新闻:OpenJDK 更新、JDK 20 发布计划、GraalVM 22.3、JReleaser 1.3.0
InfoQ
0+阅读 · 2022年11月12日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top