• 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 1000
前往

项目名称: 东北国有林区林权变化对森林景观及动物生境格局的影响

项目编号: No.41271201

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 天文学、地球科学

项目作者: 李月辉

作者单位: 中国科学院沈阳应用生态研究所

项目金额: 65万元

中文摘要: 林权制度影响下的森林景观格局变化对动物生境的影响是景观生态学中格局和过程关系这一核心理论的重要研究内容之一,已成为欧美等国的研究热点。我国国有林区林权制度改革势在必行,大小兴安岭又于2011年启动以重大国家战略:生态保护与经济转型规划,因此面临林权改革后个人承包经营的分散格局和大尺度生物保护之间的矛盾亟待解决。研究选择唯一的国有林权改革试点:黑龙江省伊春市的5个林业局为研究区,以国家二级保护物种驼鹿为代表性目标种,以试点改革形成的所有制格局为基础,模拟产生不同承包总面积和承包斑块面积的所有制格局;依据驼鹿生境选择倾向,利用生境适宜指数(HSI)模型确定其适宜生境的分布,揭示所有制格局和经营措施对生境的影响,反馈出合理的所有制格局,解决如何以大型动物生境保护为目标确定国有林区的所有制格局这一关键科学问题,丰富景观生态学核心理论,探索真实景观中模拟所有制格局的新方法,为林权改革提供生态参考。

中文关键词: 人类活动;森林景观;动物生境;鹿科动物;林权制度

英文摘要: Forestland ownership transition divide the large parcel into smaller parcels and drive strongly forest fragmentations which eventually lead to decreased habitat area and quality of forest ecosystems, which has been increasingly focused in those multi-ownership countries. The interaction between ownership pattern and habitat pattern is one of the important issues for the core theory, relationship between pattern and processes under anthropogenic activities, in landscape ecology. In northeastern national forest area,now there is an urgent need to perform the ownership reform dividing some parts of forestland owned traditionally by government to indivial landowner's parcel because of great loss in forest resources induced by consecutive harvest. Meanwhile, the forest systems are planned to be restored to the primary state for habitat conservation at large scale according to the 2011 planning of shifting management goal from timber production to ecological protection. Population of many species are sustained at larger scales than the holdings of even the continuous large government-owned forest perforated by small private parcels. Consequently, the conflict between various managements in small parcels owned by different landowners and requriement of habitat conservation at large scale is critically violent and inev

英文关键词: anthrophogenic activitiy;forest landscape;wildlife habitat;cervids;forest ownership policy

成为VIP会员查看完整内容
0

项目名称: 典型区域稻田温室气体(CH4和N2O)减排对策及机理研究

项目编号: No.41271259

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 天文学、地球科学

项目作者: 徐华

作者单位: 中国科学院南京土壤研究所

项目金额: 75万元

中文摘要: 四川、江西等省份存在大量冬季淹水或水分含量较高的稻田,其CH4排放量居于全国前列。加强这些典型区域冬季农田管理或采用以覆膜栽培为核心,结合控释肥和硝化抑制剂施用的栽培管理方式,应能大幅减少稻田温室气体排放。稳定性碳同位素方法是研究与稻田CH4排放密切相关的CH4产生和氧化等土壤微观过程的最佳手段。本项目将选择稻田CH4减排研究方面具有重要地位的两类典型稻田,四川常年淹水稻田和江西冬闲双季稻田,通过田间和培养试验,充分应用国际先进的稳定性碳同位素方法,研究冬季农田管理和水稻栽培方式等对稻田CH4和N2O排放的影响及其机理,提出综合温室效应最小、切实可行且易于大面积推广的减排措施。本项目研究结果将为稻田CH4和N2O减控措施及机理研究提供丰富信息,为我国实现减排承诺作出重要贡献。

中文关键词: 温室气体排放;排放机理;减排措施;净生态系统经济预算;稳定性碳同位素技术

英文摘要: The paddy fields under perennial flooding are the type of paddy fields highest in potential for reduction of CH4 emissions. The most effective way is undoubtedly to let this type of paddy fields drained up during the non-rice growing season. However, this mitigation option seems impractical due to water shortage in these regions. Plastic film mulching cultivation is a promising alternative technology for the traditional flooded cultivation system of rice. Water-saving management is adopted for plastic film cultivation of rice. Then, with flooded cultivation being replaced by plastic film mulching cultivation, it becomes practical to drain up rice fields perennially flooded during the non-rice growing season. While suppressing CH4 emission from rice fields, water-saving irrigation usually promotes N2O emission. The by-effect can be reduced by application of nitrification inhibitor. Unlike traditional cultivation with both basal fertilization and topdressing, fertilizer is only applied before rice transplanting for plastic film mulching cultivation. The controlled-release fertilizer may be more suitable for plastic film mulching cultivation. This experiment will be conducted in Ziyang, Sichuan province. Double-crop rice field quite high in soil moisture content during the fallow season is another type of rice fiel

英文关键词: Greenhouse gas emission;emission mechanism;mitigation options;net ecosystem economic budget;stable carbon isotope techniques

成为VIP会员查看完整内容
0

项目名称: IL-22在恒河猴SIV与TB共感染中的表达和调控机制的研究

项目编号: No.81201261

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 医学四处

项目作者: 张晶

作者单位: 武汉大学

项目金额: 23万元

中文摘要: 艾滋病的流行极大地促进了结核病的广泛传播,约1/3的艾滋病人死于结核病。因此,HIV和结核菌共感染已成为亟待解决的全球公共卫生问题。我们近期的工作表明,与SIV或结核菌单感染比较,SIV和结核菌共感染的中国恒河猴的结核病程进展迅速,存活时间明显缩短,同时也呈现白介素22在共感染组恒河猴的免疫细胞表达降低。新近的研究也显示,白介素22参与抗结核的免疫反应,而HIV则抑制其表达。本项目将利用申请者单位已经建立的中国恒河猴SIV和/或结核感染模型,系统地检测白介素22及相关分子在SIV和/或结核感染中的动态变化和差异,并探讨它们相互作用的机制。这些研究工作将为研发能有效预防或治疗艾滋病和结核共感染的疫苗或药物提供科学依据。

中文关键词: 白细胞介素-22;SIV;结核分枝杆菌;恒河猴;

英文摘要: HIV/AIDS pandemic has caused a spread of TB infection. About one third of HIV-infected patients die from TB infection. Therefore, HIV and MTB co-infection is becoming an urgent public health issue.Our recent studies showed that comparing with SIV or MTB mono-infection, SIV/MTB co-infection of Chinese rhesus monkeys had a quicker disease progression, and survived shorter.PPD-stimulated PBMCs isolated from the animals co-infected with both SIV and MTB expressed significantly lower levels of IL-22 than those from the mono-infected animals. Recent studies reported that IL-22 is involved in the host immune response to MTB infection and that HIV inhibits IL-22 expression. This project will use the SIV/MTB monkey infection model that has been established in ABSL-3 lab of Wuhan University to systematically measure dynamic changes of IL-22 ( mRNA in PBMCs and protein in plasma ) and other related molecules during the course of SIV and/or MTB infection. We will also determine the mechanisms of the interactions between SIV/MTB and IL-22. These investigations shall provide the scientific data to support the development of effective drugs for treating people infected with HIV and/or MTB.

英文关键词: IL-22;SIV;MTB;Rhesus macaque;

成为VIP会员查看完整内容
0

项目名称: 四齿大环N-杂环卡宾金属配合物的合成和反应性研究

项目编号: No.21471078

项目类型: 面上项目

立项/批准年度: 2015

项目学科: 数理科学和化学

项目作者: 陈学太

作者单位: 南京大学

项目金额: 85万元

中文摘要: N-杂环卡宾及其金属配合物是目前配位化学和金属有机化学最热门的研究领域之一。与其他类型的N-杂环卡宾金属配合物相比,大环N-杂环卡宾金属配合物研究尚处于初步阶段,只停留于少数金属配合物的合成与表征,缺乏系统深入的研究工作。大环N-杂环卡宾配体同时具有N-杂环卡宾的强给电子能力与大环配体的几何构型,它们在调变金属配合物的反应性与催化性能上有其独到之处。本项目拟研究四齿大环N-杂环卡宾配体(含其他配位原子的混合型四齿大环卡宾和由四个N-杂环卡宾单元组成的大环卡宾)金属配合物的合成,结构,反应与催化性质。主要研究内容包括四齿大环N-杂环卡宾前体物的合成,金属配合物的合成,反应性与催化性质等几个方面。开展本项目的研究不仅将扩展N-杂环卡宾和大环配合物化学的研究内容而且将丰富高价态过渡金属配合物的合成与反应性研究。

中文关键词: 大环;N-杂环卡宾;金属配合物;反应;催化

英文摘要: N-heterocyclic carbenes (NHCs) and their metal complexes are one of the hottest research topics in current coordination chemistry and organometallic chemistry. Compared to the other types of NHC metal complexes, metal complexes with macrocyclic NHC ligands, however, remained at its infancy with only few reports on the synthesis and characterization of some metal complexes. The further research into this topics is highly required. Macrocyclic NHCs have both the electronic donacity of the NHC groups and the macrocyclic effect and geometric configuration of macrocyclic framework, which would play the special roles in determining the reactivity and catalytic performance of the metal complexes. In this project we will study the synthesis, characterization, reactivity and catalytic application of metal complexes with tetradentate macrocyclic N-heterocyclic carbene ligands including those with at least one NHC group and the other donor atoms and those with four NHC groups. The researches planed include synthesis of the precursors of macrocyclic NHCs and their metal complexes and further investigation into the reactivities and catalytic performances. These researches will enrich not only coordination chemistry of N-heterocyclic carbene and macrocyclic ligands but also the synthetic and reactivity of high-valent transition metal complexes.

英文关键词: Macrocycle;N-heterocyclic carbene;metal complex;reactivity;catalysis

成为VIP会员查看完整内容
0

项目名称: 液体能量回收透平内气液两相非定常流动机理和水力学特性研究

项目编号: No.51169010

项目类型: 地区科学基金项目

立项/批准年度: 2012

项目学科: 水利工程

项目作者: 杨军虎

作者单位: 兰州理工大学

项目金额: 52万元

中文摘要: 在化工、石油等行业有大量含有一定气体的高压液体。目前国外大多利用泵反转作为液力回收透平回收利用这些高压液体的余压能量,这就需要知道泵的流量、扬程、效率、转速和反转作为液力透平使用时的流量、压头、效率、转速的换算关系。但目前研究得到的换算关系是在纯液体介质下的到的、换算关系范围很宽,不同学者研究结论差异较大。其主要原因一是理论研究和实验是以液体介质为研究对象的;二是没有得到这些换算关系和比转速的关系;另外,透平在启动过程中,即使在同一流量、压头的条件下,其运转稳定是转速范围较大。本研究以气液两相流理论为基础、利用理论推导、试验、数值模拟相结合的方法研究不同比转速的泵反转作为液力透平时两者外特性之间换算关系;研究单级泵加导叶反转作为液力透平时导叶的进出口角、导叶出口环量、叶片数对液力透平启动时其内部非定常流场及对透平转速的影响,使液力透平启动平稳后能够转速稳定,丰富水力机械流动理论。

中文关键词: 余能回收;液力透平;换算关系;气液两相;水力学特性

英文摘要:

英文关键词: energy recovery;hudraulic turbine;conversion relations;gas-liquid two-phase;hydraulic characteristics

成为VIP会员查看完整内容
0

项目名称: 阻断alpha2肾上腺素能受体抑制脓毒症性心功能障碍的作用环节研究

项目编号: No.81170222

项目类型: 面上项目

立项/批准年度: 2012

项目学科: 医学一处

项目作者: 王华东

作者单位: 暨南大学

项目金额: 57万元

中文摘要: 如何防治脓毒症性心功能障碍已成为脓毒症研究的热点问题。我们近期发现,育亨宾阻断α2肾上腺素能受体(α2-AR)可抑制内毒素引起的小鼠心功能障碍,而且育亨宾的这种效应可能与其作用于心脏局部有关。这一新的结果已在Shock杂志上发表。然而,心肌细胞上并未发现α2-AR,育亨宾阻断α2-AR抑制内毒素性心功能障碍的作用环节并不清楚。根据预实验结果,我们认为育亨宾抑制内毒素性心功能障碍与其阻断心脏交感神经突触前膜和心脏血管内皮细胞上的α2-AR有关。因此,本研究在此基础上,利用内毒素和盲肠结扎穿孔复制的脓毒症大、小鼠模型,离体心脏灌流、心肌和内皮细胞培养技术,从心功能、α2-AR亚型在心脏中的分布、TLR信号通路、炎症介质及心肌细胞凋亡的角度,证明心脏交感神经突触前膜和心脏血管内皮细胞上α2-AR的激活参与了脓毒症性心功能障碍的发病机制,为脓毒症性心功能障碍的防治提供新的思路。

中文关键词: 脓毒症心肌病;α2A-肾上腺素能受体;去甲肾上腺素;心肌细胞;心脏血管内皮细胞

英文摘要:

英文关键词: Septic cardiomyopathy;?2A-adrenergic receptor;Norepinephrine;Cardiomyocytes;Cardiac microvascular endothelial cells

成为VIP会员查看完整内容
0

项目名称: PinX1磷酸化修饰及其相互作用蛋白在调控染色体分离和染色体稳定性中的作用和分子机制研究

项目编号: No.81370647

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 医药、卫生

项目作者: 余建

作者单位: 浙江大学

项目金额: 65万元

中文摘要: 有丝分裂期染色体异常分离是导致染色体不稳定性的重要机制,在肿瘤的发生发展过程中具有重要作用。最近我们研究发现PinX1对于细胞有丝分裂期染色体的正常分离至关重要,但具体分子机制尚不明确。在前期青年科学基金项目资助下,我们发现一个新的PinX1 相互作用蛋白Plk1,也证实Plk1 在体外能够磷酸化修饰PinX1,进一步研究显示Plk1 磷酸化修饰PinX1 发生在细胞有丝分裂期,且对于细胞染色体的正常分离是必须的。本课题拟在前期工作基础上,观察Plk1 磷酸化修饰PinX1 对PinX1 调控染色体分离和染色体稳定性的影响,并进一步阐明具体分子机制;同时,筛选和鉴定新的磷酸化修饰PinX1 蛋白相互作用蛋白,并评估其在调控染色体正常分离中的作用。本项目的进行不仅有助于深入了解肿瘤发生发展机制,也为临床上开发针对染色体不稳定性的抗肿瘤靶向治疗药物,提供理论基础和实验依据。

中文关键词: PinX1;Plk1;磷酸化;染色体分离;染色体稳定性

英文摘要: It has been evident that chromosome instability due to inaccurate chromosome segregation in mitosis, plays a major role in the development of neoplasm. Recently, our study showed that PinX1 is essential for faithful chromosome segregation, but the exactly

英文关键词: PinX1;Plk1;phosphorylation;chromosome segregation;chromosome stability

成为VIP会员查看完整内容
0

项目名称: 基于广义线性函数的随机占优统计推断与证券市场投资者总体偏好

项目编号: No.71371084

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 管理科学

项目作者: 方毅

作者单位: 吉林大学

项目金额: 58万元

中文摘要: 随机占优方法被应用于风险决策各个领域,其检验可分为成对占优关系、凸占优关系和组合效率占优关系检验。成对关系检验较成熟,而凸占优和组合效率占优关系检验仍有许多不完善之处。本项目拟对随机占优的最新广义线性函数方法(Post和Kopa,2012)的统计推断加以研究:第一,提出组合效率占优关系检验的渐近和Bootstrap统计推断;第二,对凸占优关系进行进一步细分,考察细分的不同情况下检验统计量特征,利用它们与成对占优和组合效率占优关系检验统计量的联系与区别,将相应的统计推断方法推广到凸占优关系的统计推断。同时,本项目从市场效率和市场均衡出发,针对金融市场"异象",对不同证券市场,进行均值方差效率,多种经济金融学总体偏好假定的检验,探讨市场的一般和特殊规律。另外,将定价核、定价误差与总体偏好检验结果相结合,对经济金融理论和模型给出一些重要解释,对资产定价,组合管理和风险管理的实务给出有价值的建议。

中文关键词: 广义线性函数;随机占优;统计推断;总体偏好;

英文摘要: Stochastic dominance approach is applied to various areas of risk decision. The examinations of the approach can be divided into three types: pair-wise dominance relations, convex dominance relations and portfolio efficiency dominance relations. The tests

英文关键词: General linear formulation;Stochastic dominance;Statistical inference;Aggregate preferences;

成为VIP会员查看完整内容
0

项目名称: 南海北部沉积物中氮循环的关键过程研究

项目编号: No.41376086

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 天文学、地球科学

项目作者: 刘素美

作者单位: 中国海洋大学

项目金额: 85万元

中文摘要: 氮循环与海洋初级生产力、碳循环和全球气候变化息息相关。硝化、反硝化、缺氧铵氧化和NO3-异化还原为NH4+作用是氮循环的关键过程,可引起营养盐的组成和结构变动,影响浮游植物的种类组成和数量,并由此影响整个生态系统。硝化与NO3-异化还原为NH4+作用调节氮的组成,反硝化和缺氧铵氧化作用是将固定的氮转变为气态氮的重要过程。本项目充分采用15N同位素示踪技术在氮循环研究方面的优势,探讨南海北部沉积物中氮循环的关键过程,揭示南海北部沉积物中硝化速率、反硝化速率、缺氧铵氧化速率和NO3-异化还原为NH4+的速率及其分布特征与季节变化,定量给出研究区域的耗氧量及其与硝化作用的关联;定量反硝化作用和缺氧铵氧化作用去除N2的量,深入认识南海北部反硝化和缺氧铵氧化等过程对氮循环的调节机制,揭示其在富营养化演变过程中的作用,对生态系统低营养级的影响及其反馈机制,为南海生态环境的健康发展提供理论基础。

中文关键词: 氮循环;关键过程;氮同位素;沉积物;南海北部

英文摘要: Nitrogen cycling is closely related to marine primary production, carbon cycling and global climate change. Nitrification, denitrification, anaerobic oxidation of ammonium (anammox), and dissimilatory nitrate reduction to ammonium (DNRA) are key nitrogen

英文关键词: nitrogen cycling;key processes;nitrogen isotopes;sediment;South China Sea

成为VIP会员查看完整内容
0

项目名称: 银杏小孢子母细胞受秋水仙碱加倍诱导状态下的特异性应激基因表达调控机制

项目编号: No.31400562

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 农业科学

项目作者: 孙宇涵

作者单位: 北京林业大学

项目金额: 25万元

中文摘要: 多倍化是促进植物发生进化改变的重要力量。但在木本植物中,裸子植物的多倍性相对较少。银杏是雌雄异株的裸子植物,作为在植物进化史上具有特殊地位的物种,它的染色体多倍化一直是植物进化生物学和遗传育种学的亟解难题。本课题组经前期研究发现,银杏小孢子母细胞蛋白表达变化与秋水仙碱诱导银杏2n雄配子得率极低有着密切关系,并在此基础上提出了“银杏小孢子母细胞内存在影响秋水仙碱诱导银杏2n雄配子得率的特异性应激基因表达调控机制”的研究假设。为了验证这一假设,本项目采用蛋白质组和转录组关联分析方法,利用RNA-Seq和Label-free技术,以银杏小孢子母细胞和杨树花粉母细胞为对照研究对象,对比分析两者在秋水仙碱加倍诱导过程中基因表达调控方面的差异。从分子生物学角度,揭示这一过程中银杏小孢子母细胞的特异性应激基因表达调控机制。研究结果将为今后银杏倍性育种和分子育种的开展奠定基础。

中文关键词: 银杏;生理生化;转录组;蛋白质组;多组学关联分析

英文摘要: Polyploidization is an important force in promoting the evolution of plants. However, woody gymnosperms have a lower polyploidy compared with other xylophyta. Ginkgo biloba L. is dioecious gymnosperms. As a special species in the evolutionary history of p

英文关键词: Ginkgo biloba L.;Physiological and biochemical;Transcriptome;Proteome;Multi-Omics Association Analysis

成为VIP会员查看完整内容
0

选自 Ahead of AI **作者:Sebastian Raschka **

机器之心编译

推理模型发展正盛,著名 AI 技术博主 Sebastian Raschka 也正在写一本关于推理模型工作方式的新书《Reasoning From Scratch》。在此之前,他已经出版了多本 AI 领域的著名书籍,包括《Build a Large Language Model (From Scratch)》、《Machine Learning Q and AI》、《Machine Learning with PyTorch and Scikit-Learn》。

近日,他在自己的博客上放出了这本书的第一章,为 LLM 领域的推理进行了入门级的介绍,同时还概述了推断时间扩展和强化学习等技术方法。

机器之心编译了这本书的第一章,以飨读者。

图片

原文地址:https://magazine.sebastianraschka.com/p/first-look-at-reasoning-from-scratch

(注:为了行文清晰,本文会将 inference 译为「推断」,将 reasoning 译为「推理」;其中 inference 指模型根据输入生成输出的计算过程(如生成文本),而 reasoning 侧重模型通过思维链等方法进行逻辑分析、因果判断或问题解决的能力。)。

欢迎来到大型语言模型(LLM)的下一阶段:推理(reasoning)。

LLM 已经改变了我们处理和生成文本的方式,但它们的成功主要得益于统计模式识别。然而,推理方法正在取得新进展,这些新技术能让 LLM 处理更复杂的任务,例如求解逻辑难题或多步骤算术题。本书的核心便是理解这些方法。

本章将介绍的内容包括:

在 LLM 中,「推理」的具体含义; * 推理与模式匹配的根本区别; * LLM 的传统预训练和后训练阶段; * 提升 LLM 推理能力的关键方法; * 为什么从头开始构建推理模型可以帮助我们理解它们的优势、局限性和实践中权衡。

1、在 LLM 中,「推理」究竟是什么?

什么是基于 LLM 的推理(LLM-based reasoning)?这个问题的答案和讨论本身就足以写成一本书。然而,本书与之不同,目标则是从头开始实现 LLM 推理方法,因此会更注重实践和亲自动手编程,而不是概念层面上的推理。尽管如此,我认为简要定义在 LLM 语境中所说的「推理」依然很重要。

因此,在后续章节转向编程部分之前,我想在这本书的第一节定义 LLM 语境中的推理,以及它与模式匹配和逻辑推理的关系。这将为进一步讨论 LLM 目前的构建方式、它们如何处理推理任务以及它们的优点和缺点奠定基础。

在本书中,LLM 语境中的「推理」定义如下:

在 LLM 语境中,推理是指模型在提供最终答案之前产生中间步骤的能力。这个过程通常被描述为思维链(CoT)推理。在 CoT 推理中,LLM 会显式地生成结构化的陈述或计算序列,以说明其得出结论的过程。

图 1 展示了一个简单的 LLM 多步骤(CoT)推理示例。

图片

图 1:LLM 处理一个多步骤推理任务的简版示例。推理模型所做的并不是简单回忆一个事实,而是将多个中间推理步骤组合起来得出正确的结论。根据实现方式的不同,中间推理步骤可能会展示给用户,也可能不会。

从图 1 中可以看到,LLM 产生的中间推理步骤看起来非常像一个人大声表达内心的想法。然而,这些方法(以及由此产生的推理过程)与人类推理的相似度究竟如何仍是一个尚待解答的问题,本书也不会试图回答这个问题。我们甚至不清楚这样的问题是否可以得到明确解答。

相反,本书侧重于解释和实现能提升 LLM 的推理能力的技术,从而让 LLM 更好地处理复杂任务。我希望通过上手实践这些方法,你能更好地理解和改进那些正在开发中的推理方法,甚至探索它们与人类推理的异同。

注:LLM 中的推理过程可能与人类思维非常相似,特别是在中间步骤的表达方式上。然而,目前尚不清楚 LLM 推理是否在内部认知过程方面与人类推理相似。人类的推理方式通常是有意识地操控概念、直觉理解抽象关系或基于少数示例进行概括。相比之下,当前的 LLM 推理主要基于从训练数据中的大量统计相关性中学习到的模式,而不是显式的内部认知结构或有意识的反思。

因此,尽管推理增强型 LLM 的输出看起来有点像人类,但其底层机制(很可能)存在很大差异,并且这也是一个活跃的探索领域。

2、LLM 训练过程简介

本节将简要总结 LLM 的典型训练方式,以便我们更好地理解它们的设计并了解它们的局限性。这一背景也将有助于我们讨论模式匹配和逻辑推理之间的差异。

在应用任何的推理方法之前,传统的 LLM 训练通常分为两个阶段:预训练和后训练,如下图 2 所示。

图片

图 2:典型 LLM 的训练流程概述。一开始,初始模型使用随机权重初始化,然后在大规模文本数据集上通过预测下一个 token 进行预训练,以学习语言模式。然后,通过指令微调和偏好微调来优化模型,使 LLM 能够更好地遵从人类指令并与人类偏好对齐。

在预训练阶段,LLM 要使用大量(可达数 TB)未标记文本进行训练,其中包括书籍、网站、研究论文和许多其他来源。LLM 的预训练目标是学习预测这些文本中的下一个词(或 token)。

当使用 TB 级文本进行大规模预训练时,当前领先的 LLM 往往会使用数千台 GPU 运行数月时间,还会花费数百万美元资金,结果得到的 LLM 会非常强大。这意味着它们开始有能力生成与人类书写的非常相似的文本。此外,在某种程度上,经过预训练的 LLM 将开始表现出所谓的涌现属性(emergent property),这意味着它们能执行未经明确训练的任务,包括翻译、代码生成等。

然而,这些预训练模型仅仅是后训练阶段的基础模型,后训练阶段会使用两种关键技术:监督式微调(SFT,也称指令微调)和偏好微调。后训练的目的是让 LLM 学会响应用户查询,如下图 3 所示。

图片

图 3:语言模型在不同训练阶段的示例响应。图中,提示词要求总结睡眠与健康之间的关系。预训练 LLM 给出了一个相关但没有重点的答案,没有直接遵从指令。指令微调版 LLM 生成了与提示词一致的简洁准确的总结。而偏好微调后的 LLM 更进一步改善了响应 —— 使用了友好的语气和更有感召力的语言,使答案更具相关性和以用户为中心。

如图 3 所示,指令微调能提高 LLM 的个人助理类任务的能力,如问答、总结和翻译文本等等。然后,偏好微调阶段可完善这些能力。它有助于根据用户偏好定制响应。此外,偏好微调也常被用于使 LLM 更安全。(一些读者可能很熟悉基于人类反馈的强化学习(RLHF)等术语,它们是实现偏好微调的具体技术。)

简而言之,我们可以将预训练视为「原始语言预测」(通过下一 token 预测),它能为 LLM 提供一些基本属性和生成连贯文本的能力。然后,后训练阶段可通过指令微调提高 LLM 的任务理解能力,并通过偏好微调让 LLM 有能力创建具有特定风格的答案。

对 LLM 预训练和后训练阶段细节感兴趣的读者可以参阅《Build A Large Language Model (From Scratch)》。而当前这本关于推理的书无需有关这些阶段的知识 —— 你一开始就会获得一个已经经过预训练和后训练的模型。

3、模式匹配:LLM 如何从数据中学习

LLM 在训练时,会「阅读」海量的文本数据,并学习如何根据前文预测下一个 token。它们是靠发现数据中的统计规律,而不是真正「理解」内容。所以,即使它们能写出流畅、通顺的句子,但本质上只是在模仿表面的关联,而不是进行深入的思考。

目前大多数 LLM(比如 GPT-4o、Meta 的 Llama 3,除非专门训练过推理能力)都是这样工作的 —— 它们不会像人一样一步步逻辑推理,而是根据输入的问题,从训练数据中找到最可能的答案。简单来说,它们不是通过真正的逻辑推导来回答问题,更像是在「匹配」输入和输出的模式。

可以参考以下示例:

提示词:德国的首都是…… 回答:柏林

当 LLM 回答「柏林」时,它并不是通过逻辑推理得出的结论,而只是从训练数据中记住了 「德国→柏林」这个高频搭配。这种反应就像条件反射,我们称为「模式匹配」—— 模型只是在复现学到的文字规律,并没有真正一步步思考。

但如果遇到更复杂的问题呢?比如需要根据已知事实推导答案的任务?这时候就需要另一种能力:逻辑推理。

真正的逻辑推理,是指像解数学题一样,根据前提一步步推出结论。它需要中间思考步骤,能发现前后矛盾,也能基于已定的规则判断因果关系。这和单纯「匹配文字关系」完全不同。

举个例子:

所有鸟都会飞。企鹅是鸟。那企鹅会飞吗?

如果是人类(或者真正会推理的系统),马上就能发现不对劲 —— 根据前两句看起来企鹅应该会飞,但大家都知道企鹅其实不会飞,这就矛盾了(如下图 1.4 所示)

会推理的系统会立刻抓住这个矛盾,并意识到:要么第一句话说得太绝对(不是所有鸟都会飞),要么企鹅是个例外。

图片

图 4:前提矛盾导致的逻辑冲突示意图。根据「所有鸟都会飞」和「企鹅是鸟」这两句话,我们会推出「企鹅会飞」 的结论。但这个结论和已知事实「企鹅不会飞」直接冲突,这就产生了矛盾。

依靠于统计学习的 LLM 并不会主动识别这种矛盾。它只是根据训练数据中的文字规律来预测答案。如果在训练数据中「所有鸟都会飞」这个说法出现得特别多,模型就可能会自信地回答:「是的,企鹅会飞。」

在下一节中,我们将用一个具体的例子看看 LLM 遇到这个「所有鸟都会飞.……」的问题时,实际上会怎么回答。

4、模拟逻辑推理:LLM 如何在没有显式规则的情况下模仿推理逻辑

上一节我们说到,当遇到自相矛盾的前提时(比如「所有鸟都会飞,但企鹅不会飞」),普通 LLM 其实不会主动发现这些矛盾。它们只是根据训练时学到的文字规律来生成回答。

现在让我们看个具体例子(见图 5):像 GPT-4o 这样没有专门加强推理能力的模型,遇到这个「所有鸟都会飞...」的问题时,会怎么回答呢?

图片

图 5:语言模型(GPT-4o)如何处理矛盾前提的示例。 从图 5 的例子可以看到,虽然 GPT-4o 并不是专门的推理模型(不像 OpenAI 其他专门开发了推理功能的版本,比如 o1 和 o3),但它在这个问题上却给出了看似正确的回答。 这是怎么回事?难道 GPT-4o 真的会逻辑推理吗?其实不然,不过至少说明,4o 在它熟悉的场景中,能够非常逼真地「装」出逻辑推理的样子。 其实 GPT-4o 并不会主动检查说法是否自相矛盾。它的回答完全基于从海量数据中学到的「文字搭配概率」。 举个例子:如果在训练数据中,经常出现「企鹅不会飞」这样的正确说法,模型就会牢牢记住「企鹅」和「不会飞」之间的关联。就像图 5 展示的,虽然 4o 没有真正的逻辑推理能力,但靠着这种「文字概率记忆」,它也能给出正确答案。 简单来说:它不是在用逻辑规则思考,而是靠「见得多了自然记住」的方式在回答问题。 简单来说,模型之所以能「察觉」这个矛盾,是因为它在训练时反复见过类似的例子。这种能力完全来自于它在海量数据中学习到的文字规律 —— 就像我们常说的「熟能生巧」,见得多了自然就会了。 换句话说,就算像图 5 里那样,普通 LLM 看似在进行逻辑推理,其实它并不是按照规则一步步思考,而只是在运用从海量训练数据中学到的文字规律。 不过,ChatGPT 4o 能答对这个问题,恰恰说明了一个重要现象:当模型经过超大规模训练后,它的这种「隐性规律匹配」能力可以变得非常强大。但这种基于统计规律的模式也存在明显短板,比如遇到以下情况时就容易出错: * 遇到全新题型(训练数据里完全没见过的逻辑问题)→ 就像让一个只会刷题的学生突然碰到从没见过的考题; * 问题太复杂(需要环环相扣的多步推理)→ 类似让计算器解一道需要写证明过程的数学大题; * 需要严格逻辑推导(但训练数据中没有类似案例)→ 好比让背过范文的学生现场创作全新体裁的文章。

既然规则系统这么靠谱,为什么现在不流行了?其实在 80、90 年代,基于规则的系统确实很火,像医疗诊断、法律判决、工程设计这些领域都在用。直到今天,在一些性命攸关的领域(比如医疗、法律、航天),我们还是能看到它们的身影 —— 毕竟这些场合需要清晰的推理过程和可追溯的决策依据。但这种系统有个硬伤:它完全依赖人工编写规则,开发起来特别费劲。相比之下,像 LLM 这样的深度神经网络,只要经过海量数据训练,就能灵活处理各种任务,适用性广多了。

我们可以这样理解:LLM 是通过学习海量数据中的规律来「装」逻辑推理的。虽然它们内部并不运行任何基于规则的逻辑系统,但可以通过一些专门的优化方法(比如增强推理计算能力和后训练策略)来进一步提升这种模拟能力。

值得一提的是,LLM 的推理能力其实是一个渐进发展的过程。早在 o1 和 DeepSeek-R1 这类专业推理模型出现之前,普通 LLM 就已经能展现出类似推理的行为了 —— 比如通过生成中间步骤来得出正确结论。而现在我们所说的 「推理模型」,本质上就是把这种能力进一步强化和优化的结果,主要通过两种方式实现:1. 采用特殊的推断计算扩展技术,2. 进行针对性的后训练。

本书后续内容将重点介绍这些提升大语言模型解决复杂问题能力的进阶方法,帮助你更深入地理解如何增强大语言模型这种「隐性」的推理能力。

5、提升 LLM 的推理能力

大语言模型的「推理能力」真正进入大众视野,是在 2024 年 9 月 12 日 OpenAI 发布 o1 的时候。在那篇官宣文章里,OpenAI 特别提到 这些新版 AI 不像以前那样秒回,而是会像人类一样先琢磨几秒,确保答案更靠谱。 OpenAI 还特别说明:

这种强化过的思考能力,对解决科学、编程、数学等领域的复杂问题特别有帮助 —— 毕竟这些领域的问题,往往需要多转几个弯才能想明白。 虽然 o1 的具体技术细节没有公开,但普遍认为它是在 GPT-4 等前代模型基础上,通过「增强推断计算能力」来实现更强的思考能力的。 几个月后的 2025 年 1 月,深度求索公司发布了 DeepSeek-R1 模型和技术报告,详细介绍了训练推理模型的方法,引起了巨大轰动。因为: * 他们不仅免费开源了一个性能媲美甚至超越 o1 的模型; * 还公开了如何开发这类模型的完整方案。

本书将通过从零实现这些方法,带你看懂这些提升 AI 推理能力的技术原理。如图 6 所示,目前增强大语言模型推理能力的方法主要可以分为三大类:图片

图 6:提升大语言模型推理能力的三大方法。这三大方法(推断计算增强、强化学习和知识蒸馏)通常是在模型完成常规训练后使用的。所谓常规训练包括:基础模型训练、预训练、指令微调和偏好微调。

如图 6 所示,这些增强方法都是用在已经完成上述常规训练阶段的模型上的。 推断时间计算增强 推断时间计算扩展(也叫推断计算增强、测试时增强等)包含一系列在推理阶段(即用户输入提示词时)提升模型推理能力的方法,这些方法无需对底层模型权重进行训练或修改。其核心思想是通过增加计算资源来换取性能提升,借助思维链推理(chain-of-thought reasoning)及多种采样程序等技术,使固定参数的模型展现出更强的推理能力。 强化学习(RL) 强化学习是一类通过最大化奖励信号来提升模型推理能力的训练方法。其奖励机制可分为两类: * 广义奖励:如任务完成度或启发式评分 * 精准可验证奖励:如数学问题正确答案或编程任务通过率

与推断时间计算增强(inference-time compute scaling)不同,RL 通过动态调整模型参数(weights updating)实现能力提升。该机制使模型能够基于环境反馈,通过试错学习不断优化其推理策略。 注: 在开发推理模型时,需明确区分此处的纯强化学习(RL)方法与常规大语言模型开发中用于偏好微调的基于人类反馈的强化学习(RLHF)(如图 2 所示)。二者的核心差异在于奖励信号的来源:RLHF 通过人类对模型输出的显式评分或排序生成奖励信号,直接引导模型符合人类偏好行为;纯 RL 则依赖自动化或环境驱动的奖励信号(如数学证明的正确性),其优势在于客观性,但可能降低与人类主观偏好的对齐度。典型场景对比:纯 RL 训练:以数学证明任务为例,系统仅根据证明步骤的正确性提供奖励;RLHF 训练:需人类评估员对不同输出进行偏好排序,以优化符合人类标准(如表述清晰度、逻辑流畅性)的响应。

监督微调与模型蒸馏

模型蒸馏是指将高性能大模型习得的复杂推理模式迁移至更轻量化模型的技术。在 LLM 领域,该技术通常表现为:使用高性能大模型生成的高质量标注指令数据集进行监督微调(Supervised Fine-Tuning, SFT)。这种技术在 LLM 文献中常统称为知识蒸馏(Knowledge Distillation)或蒸馏(Distillation)。

与传统深度学习的区别:经典知识蒸馏中,「学生模型」需同时学习「教师模型」的输出结果和 logits,而 LLM 的蒸馏通常仅基于输出结果进行迁移学习。

注:本场景采用的监督微调(SFT)技术与常规大语言模型开发中的 SFT 类似,其核心差异体现在训练样本由专为推理任务开发的模型生成(而非通用 LLM)。也因此,其训练样本更集中于推理任务,通常包括中间推理步骤。

6、从头构建推理模型的重要性

自 2025 年 1 月 DeepSeek-R1 发布以来,提高 LLM 的推理能力已成为 AI 领域最热门的话题之一。原因也不难理解。更强的推理能力使 LLM 能够解决更复杂的问题,使其更有能力解决用户关心的各种任务。 OpenAI CEO 在 2025 年 2 月 12 日的一份声明也反映了这种转变: 我们接下来将发布 GPT-4.5,即我们在内部称之为 Orion 的模型,这是我们最后一个非思维链模型。在此之后,我们的首要目标是统一 o 系列模型和 GPT 系列模型,方法是打造可以使用我们所有工具、知道何时需要或不需要长时间思考并且可以广泛用于各种任务的系统。 以上引文凸显了领先的 LLM 提供商向推理模型的转变。这里,思维链是指一种提示技术,其能引导语言模型逐步推理以提高其推理能力。 另一点也值得一提,「知道何时需要或不需要长时间思考」也暗示了一个重要的设计考量:推理并不总是必要或可取的。 举个例子,推理模型在设计上就是为了解决复杂任务设计的,如解决难题、高级数学问题和高难度编程任务。然而,对于总结、翻译或基于知识的问答等简单任务来说,推理并不是必需的。事实上,如果将推理模型用于一切任务,则可能效率低下且成本高昂。例如,推理模型通常使用起来成本更高、更冗长,有时由于「过度思考」更容易出错。此外,这里也适用一条简单的规则:针对具体任务使用正确的工具(或 LLM 类型)。 为什么推理模型比非推理模型成本更高? 主要是因为它们往往会产生更长的输出,这是由于中间推理步骤解释了得出答案的方式。如图 7 所示,LLM 一次生成一个 token 的文本。每个新 token 都需要通过模型进行完整的前向传递。因此,如果推理模型产生的答案是非推理模型的两倍长,则需要两倍的生成步骤,从而导致计算成本增加一倍。这也会直接影响 API 使用成本 —— 计费通常基于处理和生成的 token 数量。图片

图 7:LLM 中的逐个 token 生成。在每一步,LLM 都会获取迄今为止生成的完整序列并预测下一个 token—— 可能代表词、子词或标点符号,具体取决于 token 化器。新生成的 token 会被附加到序列中,并用作下一步的输入。这种迭代解码过程既用于标准语言模型,也用于以推理为中心的模型。 这直接凸显了从头开始实现 LLM 和推理方法的重要性。这是了解它们的工作方式的最佳方式之一。如果我们了解 LLM 和这些推理模型的工作原理,我们就能更好地理解这些权衡。 7、总结 * LLM 中的推理涉及使用中间步骤(思维链)来系统地解决多步骤任务。 * 传统的 LLM 训练分为几个阶段:预训练,模型从大量文本中学习语言模式;指令微调,可改善模型对用户提示词的响应;偏好微调,使模型输出与人类偏好对齐。 * LLM 中的模式匹配完全依赖于从数据中学习到的统计关联,这可使得文本生成流畅,但缺乏明确的逻辑推理。 * 可以通过这些方式来提高 LLM 中的推理能力:推断时间计算扩展,无需重新训练即可增强推理能力(例如,思维链提示);强化学习,使用奖励信号显式地训练模型;监督微调和蒸馏,使用来自更强大推理模型的示例。 * 从头开始构建推理模型可以提供有关 LLM 能力、局限性和计算权衡的实用见解。

以上就是 Sebastian Raschka 新书《Reasoning From Scratch》第一章的主要内容,可以说通过一些基础介绍为这本书奠定了一个很好的基调。你对推理模型有什么看法,对这本书有什么期待吗?

成为VIP会员查看完整内容
29

推荐系统在现代生活中无处不在,是互联网科技巨头的主要变现渠道之一。本书旨在帮助研究生、研究人员及工程实践者深入掌握这一前沿领域,建立扎实的理论理解与实战技能。书中不仅介绍了深度学习与生成式人工智能在推荐模型中的应用,还重点探讨了推荐系统在工业界的整体架构。 作者详细剖析了 YouTube、阿里巴巴、Airbnb 和 Netflix 等企业在推荐系统中的实际部署方案,涵盖模型训练、模型服务、特征存储与数据流处理等机器学习系统架构与工程细节。本书内容融合理论与实践,为读者提供全面的技术视角与实操指导。


评论

“推荐系统具有巨大的商业价值,深度学习正在将其推向新的高度。本书聚焦于实际应用,为工程师构建更智能、更高效的推荐系统提供了强有力的工具支持。其清晰而实用的讲解方式,使本书成为掌握该领域最新进展的必备指南。” — Yue Zhuge,NGP Capital

“阅读本书,你将深入了解推荐系统背后丰富的资源与工程实践。作者分享了将学术研究与产业应用相结合的独特见解,为技术从业者与学生提供了宝贵的技术参考。本书强调创新思维,激发读者在推荐系统技术中探索新方案。” — Zi Yang,Google DeepMind


精选推荐语

探索深度学习在推荐系统中的前沿应用,这是互联网主要变现方式之一。

成为VIP会员查看完整内容
18
继续向下滚动查看精品内容
本周荟萃主题
区块链
区块链(Blockchain)是由节点参与的分布式数据库系统,它的特点是不可更改,不可伪造,也可以将其理解为账簿系统(ledger)。它是比特币的一个重要概念,完整比特币区块链的副本,记录了其代币(token)的每一笔交易。通过这些信息,我们可以找到每一个地址,在历史上任何一点所拥有的价值。
深度学习
机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。
机器学习
“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。”

——中文维基百科
强化学习
强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。
推荐系统
推荐系统,是指根据用户的习惯、偏好或兴趣,从不断到来的大规模信息中识别满足用户兴趣的信息的过程。推荐推荐任务中的信息往往称为物品(Item)。根据具体应用背景的不同,这些物品可以是新闻、电影、音乐、广告、商品等各种对象。推荐系统利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。
卷积神经网络
在深度学习中,卷积神经网络(CNN或ConvNet)是一类深度神经网络,最常用于分析视觉图像。基于它们的共享权重架构和平移不变性特征,它们也被称为位移不变或空间不变的人工神经网络(SIANN)。它们在图像和视频识别,推荐系统,图像分类,医学图像分析,自然语言处理,和财务时间序列中都有应用。
计算机网络
计算机网络( Computer Networks )指将地理位置不同的多台计算机及其外部设备,通过通信线路连接起来,在网络操作系统及网络通信协议的管理和协调下,实现资源共享和信息传递的计算机系统。
命名实体识别
命名实体识别(NER)(也称为实体标识,实体组块和实体提取)是信息抽取的子任务,旨在将非结构化文本中提到的命名实体定位和分类为预定义类别,例如人员姓名、地名、机构名、专有名词等。
机器翻译
机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。
计算机视觉
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。
微信扫码咨询专知VIP会员