• 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 1000
前往

项目名称: 脑血管内皮细胞介导神经胶质母细胞瘤沿血管侵袭的机制研究

项目编号: No.81402240

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 医药、卫生

项目作者: 邓森议

作者单位: 四川大学

项目金额: 23万元

中文摘要: 胶质母细胞瘤(GBM)是常见的恶性颅内肿瘤,目前病人的中位生存期为12.1-14.6个月。胶质母细胞瘤病人预后差的根本原因在于肿瘤在脑部的恶性侵袭(Invasion),但是其机制还不明确。在前期工作中我们发现GBM肿瘤细胞通常沿血管侵袭(Vessel co-option),并呈现出上皮间充质转化(EMT)的特征。近期研究同时表明脑血管内皮细胞能分泌TGF-β,SDF-1等相关因子,提示脑血管内皮细胞可能介导了胶质母细胞瘤侵袭。于是我们猜测GBM肿瘤侵袭的可能机制:在脑血管内皮细胞诱导和招募下GBM肿瘤细胞干细胞(GSCs)通过上皮间充质转化(EMT)获得侵袭能力并不断靠近血管,最后沿血管支架向外侵袭。本项目旨在采用临床标本检测、斑马鱼活体动态模型观察以及体外细胞3D培养等试验技术深入研究脑血管内皮细胞作用于GBM肿瘤细胞沿血管侵袭过程的机制并探索不同侵袭方式与病人预后的关系。

中文关键词: 1胶质母细胞瘤侵袭;2脑血管内皮细胞;3肿瘤细胞包裹血管;4上皮间充质转化;5原位斑马鱼胶质母细胞瘤模型

英文摘要: As one of the most common primary brain tumor, Glioblastoma multiforme (GBM) earning a poor prognosis in clinical therapy mainly caused by its diffused growth nature, the median overall survival rate of GBM patients was about 12.1-14.6 months. Unfortunat

英文关键词: 1GBM invasion;2BMECs;3Vessel co-option;4EMT;5In vivo zebrafish glioblastoma model

成为VIP会员查看完整内容
0

项目名称: 具有调控VSMC增殖信号通路的新型二氢黄酮类小分子的构建及其调控机制研究

项目编号: No.81172938

项目类型: 面上项目

立项/批准年度: 2012

项目学科: 药物学、药理学

项目作者: 李青山

作者单位: 山西医科大学

项目金额: 45万元

中文摘要: 抑制血管平滑肌细胞(VSMC)增殖是防治动脉粥样硬化等心血管疾病的重要策略。本项目以前期发现的杜鹃素类衍生物能显著抑制VSMC增殖以及杜鹃素可调控人主动脉血管平滑肌细胞(HA-VSMC)丝裂原活化蛋白激酶(MAPK)信号通路结果为基础,结合Angiotensin Ⅱ通过MAPK信号通路诱导VSMC增殖的科学依据,以杜鹃素为先导物,基于前期已阐明的构效关系,进一步系统构建合成具有高效抑制VSMC增殖的小分子化合物;并以此类高活性小分子化合物为分子探针,通过化学生物学、细胞分子生物学探讨其调控VSMC增殖的MAPK信号通路。进一步通过蛋白质组学深入研究此类活性化合物抑制VSMC增殖作用前后蛋白质谱的改变,经图像分析后选取差异蛋白斑点进行MALDI-TOF-MS和ESI-MS鉴定目标蛋白,寻找与VSMC增殖相关的新信号调节靶蛋白,综合分析探讨此类小分子在VSMC增殖信号通路中的调控作用与机制。

中文关键词: 二氢黄酮;靶蛋白;血管平滑肌;葡萄糖调节蛋白;分子机制

英文摘要:

英文关键词: Flavanone;Protein target;VSMC;GRP78;Molecular mechanism

成为VIP会员查看完整内容
0

项目名称: 纵向磁场下中频真空电弧集聚行为及其控制机理研究

项目编号: No.51377007

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 电工技术

项目作者: 武建文

作者单位: 北京航空航天大学

项目金额: 85万元

中文摘要: 随着多电/全电飞机的发展,中频(360Hz~800Hz)发电技术将全面应用于航空供电系统。目前航空供电系统采用空气断路器控制保护,而频率越高电弧开断越困难,严重限制了供电系统向大容量方向发展。真空开关技术开断性能好,环境适应性强,具有应用于航空供电系统的优势,而中频真空电弧开断性能研究是其成功应用的关键问题。本课题以中频真空电弧为研究对象,从微观参数和宏观形态角度出发,实验分析真空电弧等离子体的电子温度和电子密度分布特性,观测纵向磁场中不同电流等级在不同频率下的真空电弧形态及快速演变过程,分析影响电弧集聚行为的因素,建立中频真空电弧等离子体的磁流体动力学模型,研究触头结构参数、触头开距、外加磁场与产生阳极斑点的电流阈值的关系,进而掌握中频真空电弧集聚行为的控制机理,提高真空开关开断能力,为研制适用于航空中频和工业中频电源系统的开断容量为20kA的小型化真空开关提供理论依据。

中文关键词: 中频真空电弧;纵向磁场;集聚行为;阳极斑点;真空开关

英文摘要: With the development of more-electric aircraft (MEA) and all-electric aircraft (AEA), intermediate-frequency (360Hz~800Hz) power supply system is becoming popular. Air circuit breaker is widely used for protecting aero generator. Arc interruption in air b

英文关键词: intermediate-frequency vacuum arc;constricted behavior;axial-magnetic-field;anode spot;vacuum switch

成为VIP会员查看完整内容
0

项目名称: 新型碱蒸汽后处理工艺在多级孔沸石材料中的应用及材料催化性质研究

项目编号: No.21301123

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 数理科学和化学

项目作者: 李华

作者单位: 苏州大学

项目金额: 25万元

中文摘要: 多级孔沸石作为潜在的下一代催化材料要走向应用必须解决好两个关键问题:沸石晶化(小孔)与大孔/介孔的协同形成以及多级孔材料的异质复合。就多级孔的协同形成而言,分相一直是困扰合成的重要问题。本项目创新性的提出通过对介孔模板剂和沸石结构导向剂的配对组合,巧妙地绕开在溶液合成初期的分相条件,采用区别于传统蒸汽处理和直接水热等常用工艺的新型碱蒸汽后处理工艺,独创地将蒸汽处理和强碱促进矿化过程相结合,进行多级孔沸石材料的合成研究,进一步通过多种创新工艺制备2-3种新型多级孔沸石材料,希望获得可调酸性多级孔沸石新材料,同时以其催化制备生物柴油为探针反应来表征合成材料的催化效果。国内外这方面的研究尚鲜见报道,立意特色鲜明,项目的实施对催化科学的发展具有一定的理论意义,对多级孔沸石催化剂的实际推广具有很强的现实意义。

中文关键词: 多级结构;沸石;沸石晶元;碱蒸汽;介孔材料

英文摘要: Hierarchically porous zeolites are thought to be the coming generation of catalysts. As far as their applications are concerned, there are yet two fundamental problems unresolved: the various kinds of pore networks formed almost simultaneously and the composites of hierarchically porous zeolites. In terms of the cooperative formation among various pore networks, phase separation longly troubles most of researchers. In this project, a novel alkaline steam-assisted post-crystallization process will be used to synthesize various hierarchically porous zeolites. In this process, phase separation, happening mainly during primarily solution synthesis, could be avoided effectively through creatively sorting and combining two kinds of templates. Different from conventional steam-assisted post-crystallization and direct hydrothermal treatment, steam-assisted treatment and crystallization of zeolite in strong alkaline environment are creatively combined with each other. Based on such synthesis, 2 or more novel hierarchically porous zeolites with controllable acidity would be further achieved. The prospective biodiesel applications of these novel materials were used to assess the catalystic activity. This research is few reported in the world, as far as we know. It makes its feature of explicit idea, extraordinary novelty

英文关键词: Hierarchical structures;Zeolites;Zeolite seed;Alkaline steaming;Mesoporous materials

成为VIP会员查看完整内容
0

项目名称: 微纳米超磁致伸缩材料多场耦合本构关系及动力学特性研究

项目编号: No.50901039

项目类型: 青年科学基金项目

立项/批准年度: 2010

项目学科: 电工技术

项目作者: 那日苏

作者单位: 内蒙古师范大学

项目金额: 10万元

中文摘要: (1)研究建立能够有效描述磁性超薄膜及多层薄膜体系中表面界面效应、磁致伸缩现象以及多场耦合本构关系的细观理论,获得有效的材料弹性模量,磁弹性耦合系数与材料尺度和结构的关系;进一步,获得多层体系的有效本构关系和应力相关的理论知识,为进一步的研究工作提供较完整的理论基础;(2) 针对多层薄膜体系的多畴结构,考虑表面界面修正现行磁化模拟理论,给出体系的磁化行为,获得层间耦合,表面界面畴壁钉扎等效应对多层体系的磁弹性耦合、磁化曲线、磁致伸缩曲线、 应力效应以及温度效应的影响,解释近期的实验结果;(3) 深入研究多层悬臂梁结构的动态弯曲和扭转等动态磁机械耦合机制及相关性质,研究体系共振行为,探索动态磁弹性耦合体系中新的耦合模式,解释相关的、以及有争议的实验现象,并进一步探索体系在MEMS/NEMS中的应用导向。为在可控物理条件下优化悬臂梁结构性能提供重要的理论依据。

中文关键词: 铁弹性;本构模型;动力学性质;表面效应;

英文摘要:

英文关键词: ferroelasticity;constitutitive model;dynamical property;surface effect;

成为VIP会员查看完整内容
0

项目名称: 星载压缩采样数字阵列天线阵元信息重构与快速波束赋形研究

项目编号: No.61501240

项目类型: 青年科学基金项目

立项/批准年度: 2016

项目学科: 无线电电子学、电信技术

项目作者: 马晓峰

作者单位: 南京理工大学

项目金额: 21万元

中文摘要: 星载移动卫星通信天线系统一般需要形成数十个独立的收发赋形波束覆盖目标区域,相比模拟多波束形成和相控阵天线,采用数字波束形成技术的数字阵列天线具有方向图优化灵活和空域干扰抑制能力强的优点。但是,大规模数字阵列的星载应用还面临着体积、重量和功耗等限制以及任意形状波束赋形快速优化问题。本课题拟从通信信号空间分布的稀疏性出发,研究大规模数字接收阵列天线阵元压缩采样稀布和满阵信息重构方法,旨在将阵元稀布优化与方向图优化分离,达到在波束性能与满阵相似的前提下,大幅减少阵元数量的目的;另外,针对移动卫星通信系统空域实时抗干扰的需求,研究能够产生低零限的任意形状低旁瓣方向图快速波束赋形方法,旨在实现星载平台的实时计算,达到快速响应和实时抑制突发干扰的目的。本课题着力构建一种新的具有空域强干扰动态抑制的星载数字接收多波束天线架构,为大规模数字阵列天线在移动卫星通信系统中的应用开辟新思路并奠定坚实的理论基础。

中文关键词: 移动卫星通信;数字阵列天线;压缩采样;信息重构;快速波束赋形

英文摘要: Transmit and receive antennas of the space-borne mobile satellite communication system are generally required to form multiple independent shaped beam-patterns covering the interested area respectively. Compared to analog multi-beam networks and phased array antennas, the digital array antennas employing digital beam-forming (DBF) technique provide the abilities to optimize beam-pattern flexibly and suppress interference effectively. However, the large-scale digital array in space-borne application is also limited by size, weight, power dissipation and the real-time problem of beam-pattern synthesis optimization. This research topic intends to investigate the compressed sampling sparse array optimization of large-scale receive array and full array antenna element information reconstruction techniques, based on the fact of the sparsity of spatial distributed communication signals, which are aimed at separating the element antenna position optimization from the beam-pattern optimization and significantly reduce the number of antennas with small performance loss. In addition, in order to satisfy the spatial anti-jamming requirement of mobile satellite communication system, fast synthesis optimization methods of arbitrary shaped low sidelobe beam-pattern with deep null will be investigated, which are aimed at the effective realization on space-borne platform to rapidly response and suppress burst interferences in real time. This research topic focuses on building new space-borne digital muti-beam receive antenna architecture with the spatial anti-jamming ability, which will open up a new idea and lays a solid theoretical foundation for large-scale digital array in space-borne system application.

英文关键词: Mobile Satellite Communication;Digital Array Antenna(DAR);Compressed Sampling;Information Reconstruction;Fast Pattern Synthesis

成为VIP会员查看完整内容
0

项目名称: 大气中单萜烯与氯气、臭氧的反应动力学及机理研究

项目编号: No.41275136

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 天文学、地球科学

项目作者: 吴海

作者单位: 中国计量科学研究院

项目金额: 80万元

中文摘要: 单萜烯是大气中重要的一类挥发性有机物,其在大气中的氧化反应对二次有机气溶胶以及光氧化剂形成具有重要作用,为此,大气中单萜烯的氧化反应动力学和机理研究受到广泛关注。目前部分单萜烯与O3反应速率常数测定结果存在很大的不确定性,而且缺乏反应速率常数对温度的依赖系数研究;关于单萜烯与Cl2反应的动力学和机理研究尚未见文献报道。本申请项目拟采用室内烟雾箱为手段,研究大气中单萜烯化合物与Cl2和O3的反应。通过绝对速率方法和相对速率方法,测定上述单萜烯反应的速率常数及其对温度的依赖系数,并评估单萜烯与Cl2暗反应对大气中单萜烯汇机制的重要性;研究单萜烯和Cl2暗反应体系的主要产物及其产率,认识单萜烯与Cl2暗反应的机理,进而为正确评估单萜烯与Cl2的暗反应对单萜烯大气化学过程的影响提供新的科学依据。

中文关键词: 单萜烯;氯原子;臭氧;反应速率常数;

英文摘要: Monoterpenes are important species in atmospheric VOCs, and its atmospheric oxidation plays significant role in formation of second organic aerosol, and photooxidant. Hence, kinetic and mechanistic study about atmospheric oxidation of monoterpenes has received great interest. However, there are still large uncertainty in the rate constant and lack of temperature dependence of rate constant for reactions of some monoterpenes with ozone. There seems no kinetic and mechnistic data reported on the reaction of monoterpenes with molecular chlorine yet. By using indoor smog chamber, reactions of atmospheric monoterpenes with molecular chlorine and ozone are studied. Rate constants for the above reactions as well as their dependence on temperature will be measured by absolute or relative rate techniques. Impact of monoterpenes' reaction with molecular chlorine on the sink of atmospheric monoterpene will be evaluated. By investigating the major products as well as the formation yields, the mechanisms of reaction of monoterpene with molecular chlorine be discussed. The obtained kinetics and mechanisms data will be used to evaluate the contribution of monoterpene's dark reaction with chlorine on its atmospheric processes.

英文关键词: monoterpene;chlorine atom;ozone;reaction rate constant;

成为VIP会员查看完整内容
0

项目名称: 大规模集群环境中虚拟机迁移关键技术及相关算法研究

项目编号: No.61202061

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 计算机科学学科

项目作者: 向小佳

作者单位: 中国科学院计算技术研究所

项目金额: 24万元

中文摘要: 数据的裂变式增长,使得面向海量数据处理的大规模集群技术成为了未来的研究方向,在这样的背景下,虚拟机迁移技术能够打包资源与服务使其跨越物理节点边界的鸿沟,将异构的集群硬件资源转换为一个同质资源池,其重要性不言而喻。但是,已有的迁移技术都存在不足,面对不断扩张的集群规模无法做到一致高效的实时迁移,同时,新环境也带来了新挑战,如多虚拟机的并行迁移调度问题。本项目拟首次提出无宕机实时迁移技术,以多模式可变粒度Shadow Memory、外存访问跟踪、堆栈式用户态迁移体系等技术和机制为支撑,以最小化迁移时间、最大化服务质量为目标,结合内外存数据调度模型与算法,实现大规模集群环境中的虚拟机一致高效实时迁移。同时,本项目拟对迁移框架技术展开深入研究,通过行为模拟和成本估算,将多种虚拟机迁移过程模型化,进而以成本最小化为目标,设计并实现一整套指导和协调大规模集群环境中虚拟机并行迁移的相关算法。

中文关键词: 无宕机实时迁移;迁移本体技术;堆栈式迁移体系;事务内存;大数据处理

英文摘要: Digital data explosion mandates the development of cloud cluster technology. Because of the ease with which computing and storage resources can be wrapped and migrated around the cloud cluster, virtual-machine migration technology becomes more and more important in order to transform the cloud cluster from a collection of heterogeneous physical nodes to a huge pool of homogeneous resources. Unfortunately, none of existing approaches and technologies can provide optimized support for seamless live migrations of virtual-machines in cloud cluster, let alone the vision of efficiently pooling geographically distributed cluster resources. Furthermore, new challenges arise in this field, such as the problem of parallel scheduling of virtual-machines migrations and dynamic consolidating of resources in cloud cluster. In this proposal, we plan to present the non-suspend live migration approach for the first time. With the needs of research on multi-mode & multi-granularity shadow memory mechanism, storage trace-map mechanism, user-mode migration protocol stack, transfer block based access pattern prediction technology, and the non-suspend data scheduling model & algorithm, the non-suspend live migration approach can support seamless transfer of virtual-machines over low bandwidth and high latency links while minimizing t

英文关键词: Non-Suspend Live Migration;Migration Ontology;Stack Style Migration Framework;Transaction Memory;Big Data Processing

成为VIP会员查看完整内容
0

项目名称: ADAM10通路在小脑神经细胞发育中的作用和机制研究

项目编号: No.81400931

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 医药、卫生

项目作者: 郭志宝

作者单位: 首都医科大学

项目金额: 22万元

中文摘要: 小脑是运动协调的重要器官,其发育异常与临床多种疾病相关。Adam10(A Disintegrin And Metalloprotease 10)基因是Adams家族的重要成员,研究表明其在哺乳动物大脑皮层发育过程中发挥重要作用。目前,adam10基因在小脑发育过程的作用尚不清楚。我们前期采用Cre/loxP条件性基因敲除技术获得了神经细胞特异性adam10基因敲除小鼠,发现该小鼠小脑分叶和皮层结构缺陷、细胞发育及分布异常。本项目拟在前期已获得的adam10基因敲除鼠模型基础上,采用免疫组织化学、免疫印迹及共沉淀、原位杂交和在体电转染等技术,研究adam10基因敲除对小脑星形胶质细胞、颗粒细胞和浦肯野细胞的增生、凋亡、分化、迁移等的影响,并分析相关蛋白分子及其信号通路的改变,另通过挽救实验进一步验证adam10基因在小脑发育过程中的作用。该课题的完成将为临床神经系统相关疾病的防治提供新思路。

中文关键词: adam10;基因敲除;小脑;发育异常;

英文摘要: The cerebellum is a morphologically unique brain structure made up of an elaborate set of folia separated by fissures. Recent evidence suggests that the cerebellum participates in higher order functions, including cognition, emotion and language processin

英文关键词: adam10;gene knockout;cerebellum;displasia;

成为VIP会员查看完整内容
0

项目名称: 滞止流场非均相燃烧系统及颗粒流着火特性研究

项目编号: No.51406101

项目类型: 青年科学基金项目

立项/批准年度: 2015

项目学科: 工程热物理与能源利用学科

项目作者: 吴宁

作者单位: 清华大学

项目金额: 10万元

中文摘要: 燃料颗粒特别是煤粉的实际反应大都发生在有拉伸流场中,探索均匀单分散颗粒流在有拉伸流场中的着火特性和机理,对推动工业燃烧和污染物减排研究、发展推进技术乃至国防科技均有重要作用。本课题基于对冲射流纯一维特性及拉伸率可控的优点,通过研制均匀单分散颗粒流的产生及输运方法和装置、建立新型对冲颗粒流非均相反应可视化平台,能够精确测量和控制流场拉伸率、颗粒数浓度及质量流率,并以准稳态的来流加热条件测量颗粒着火温度,基于高速摄像技术获得颗粒着火的瞬态特性,基于像增强技术和图像统计算法获得颗粒着火的平均特性。进而以煤粉为研究对象,分别考察拉伸率对单颗粒煤及煤粉云着火特性的影响,建立拉伸流场中颗粒着火特性评价指标和方法、分析影响机理并开展模型预报。从而为改良煤粉燃烧器、提高颗粒流的稳燃性和燃烧效率提供新的视角和理论支持。

中文关键词: 非均相对冲;煤粉云;着火;;

英文摘要: Fuel particles, especially pulverized coal, usually react in a strained flow circumstances. Exploring the ignition characteristics of uniform mono-dispersed particle-laden flow in a strained flow is highly useful to the developing of industrial combustion process, as well as the research of aerospace propulsion. This work is aimed at the experimental solution and a theoretical model which can give the detailed mechanism of this question. Based on the one-dimensional counterflow jet system, a new-style mono-dispersed particle generator will be developed, and a high-speed camera together with an ICCD camera will be used to capture and characterize the ignition process of the particle-laden flow. Then a series of experiments focused on ignition of pulverized coal will be carried out to find the regular pattern. Based on the data, a new transient ignition model considering the modification of diffusion term caused by strain rate will be developed to explain and forecast the ignition characteristics of particle-laden flows in stagnation flow.

英文关键词: heterogeneous counterflow;pulverized coal dust;ignition;;

成为VIP会员查看完整内容
0

2022 年 11 月,ChatGPT 的问世展示了大语言模型的强大潜能,并迅速引起了广泛关注。ChatGPT 能够有效理解用户需求,并根据上下文提供恰当的回答。它不仅可以进行日常对话,还能够完成复杂任务,如撰写文章、回答问题等。令人惊讶的是,所有这些任务都由一个模型完成。在许多任务上,ChatGPT 的性能甚至超过了针对单一任务进行训练的有监督算法。这对于人工智能领域具有重大意义,并对自然语言处理研究产生了深远影响。

然而,由于 OpenAI 并未公开 ChatGPT 的详细实现细节,整体训练过程包括语言模型、有监督微调、类人对齐等多个方面,这些方面之间还存在大量的关联,这对于研究人员在自然语言处理基础理论和机器学习基础理论上要求很高。此外,大语言模型的参数量非常庞大,与传统的自然语言处理研究范式完全不同。使用大语言模 型还需要分布式并行计算的支持,这对自然语言处理算法研究人员又进一步提高了要求。

为了使得更多的自然语言处理研究人员和对大语言模型感兴趣的读者能够快速了解大语言模型和理论基础,并开展大语言模型实践,复旦大学自然语言处理实验室张奇教授、桂韬研究员、郑锐博士生以及黄萱菁教授结合之前在自然语言处理领域研究经验,以及分布式系统和并行计算的教学经验,通过在大语言模型实践和理论研究的过程中,历时 8 个月完成本书。希望这本书能够帮助读者快速入门大语言模型的研究和应用,并解决相关技术挑战。

点击 阅读原文 或访问 https://intro-llm.github.io/ 获取本书全文

条分缕析,梳理大规模预训练技术路线

《大规模语言模型·从理论到实践》旨在为对大语言模型感兴趣的读者提供一个入门指南,并可作为高年级本科生和研究生自然语言处理相关课程的大语言模型部分补充教材。鉴于大语言模型的研究仍在快速发展阶段,许多方面尚未达成完整结论或普遍共识。在撰写本书时,我们力求全面展现大模型研究的各个方面,并避免给出没有广泛共识的观点和结论。大语言模型涉及深度学习、自然语言处理、分布式计算、分布式计算等众多领域。因此,建议读者在阅读本书之前,首先系统地学习深度学习和自然语言处理的相关课程。在分布式计算和异构计算方面,读者需要具备基本的概念。如果希望在大语言模型训练和推理方面进行深入研究,还需要系统学习分布式系统、并行计算、CUDA 编程等相关知识。

本书围绕大语言模型构建的四个主要阶段:预训练、有监督微调、奖励建模和强化学习,详细介绍各阶段使用的算法、数据、难点以及实践经验。

预训练阶段需要利用包含数千亿甚至数万亿单词的训练数据,并借助由数千块高性能 GPU 和高速网络组成的超级计算机,花费数十天完成深度神经网络参数的训练。这一阶段的核心难点在于如何构建训练数据以及如何高效地进行分布式训练。

有监督微调阶段利用少量高质量的数据集,其中包含用户输入的提示词(Prompt)和对应的理想输出结果。提示词可以是问题、闲聊对话、任务指令等多种形式和任务。这个阶段是从语言模型向对话模型转变的关键,其核心难点在于如何构建训练数据,包括训练数据内部多个任务之间的关系、训练数据与预训练之间的关系以及训练数据的规模。 奖励建模阶段的目标是构建一个文本质量对比模型,用于对于同一个提示词,对有监督微调模型给出的多个不同输出结果进行质量排序。这一阶段的核心难点在于如何限定奖励模型的应用范围以及如何构建训练数据。 强化学习阶段根据数十万提示词,利用前一阶段训练的奖励模型,对有监督微调模型对用户提示词补全结果的质量进行评估,并与语言模型建模目标综合得到更好的效果。这一阶段的难点在于解决强化学习方法稳定性不高、超参数众多以及模型收敛困难等问题。 除了大语言模型的构建,本书还进一步介绍了大语言模型的应用和评估方法。主要内容包括如何将大语言模型与外部工具和知识源进行连接、如何利用大语言模型进行自动规划完成复杂任务,以及针对大语言模型的各类评估方法。


It's Just the Beginning

虽然本书写作时间只有 8 个月,但是章节内部结构也是几易其稿,经过几次大幅度调整和重写。受限于我们的认知水平和所从事的研究工作的局限,对其中一些任务和工作的细节理解可能存在不少错误,也恳请专家、读者批评指正!

转发福利

点击转发并获赞满50个

截图加微信:Dreams21111617

并注明“集赞满50以上”

前10名可免费获得签名版纸质《自然语言处理导论》!

联系方式:cs_nlp@fudan.edu.cn地址:复旦大学江湾校区交叉二号楼

责任编辑:窦士涵、刘妍

成为VIP会员查看完整内容
152

AI Agent(人工智能代理)是一种能够感知环境、进行决策和执行动作的智能实 体。不同于传统的人工智能,AI Agent 具备通过独立思考、调用工具去逐步完成给 定目标的能力。AI Agent 和大模型的区别在于,大模型与人类之间的交互是基于 prompt 实现的,用户 prompt 是否清晰明确会影响大模型回答的效果。而 AI Agent 的工作仅需给定一个目标,它就能够针对目标独立思考并做出行动。和传统的 RPA 相比,RPA 只能在给定的情况条件下,根据程序内预设好的流程来进行工作的处 理,而 AI Agent 则可以通过和环境进行交互,感知信息并做出对应的思考和行动。

大语言模型的浪潮推动了 AI Agent 相关研究快速发展,AI Agent 是当前通往 AGI 的主要探索路线。大模型庞大的训练数据集中包含了大量人类行为数据,为模拟类 人的交互打下了坚实基础;另一方面,随着模型规模不断增大,大模型涌现出了上 下文学习能力、推理能力、思维链等类似人类思考方式的多种能力。将大模型作为 AI Agent 的核心大脑,就可以实现以往难以实现的将复杂问题拆解成可实现的子任 务、类人的自然语言交互等能力。由于大模型仍存在大量的问题如幻觉、上下文容 量限制等,通过让大模型借助一个或多个 Agent 的能力,构建成为具备自主思考决 策和执行能力的智能体,成为了当前通往 AGI 的主要研究方向。

一个基于大模型的 AI Agent 系统可以拆分为大模型、规划、记忆与工具使用四个组 件部分。AI Agent 可能会成为新时代的开端,其基础架构可以简单划分为 Agent = LLM + 规划技能 + 记忆 + 工具使用,其中 LLM 扮演了 Agent 的“大脑”,在这个 系统中提供推理、规划等能力。

AI Agent 发展迅速,出现多款“出圈”级研究成果。2023 年 3 月起,AI Agent 领 域迎来了第一次“出圈”,西部世界小镇、BabyAGI、AutoGPT 等多款重大 Agent 研究项目均在短短两周内陆续上线,引发了大家对 AI Agent 领域的关注。目前已经 涌现了在游戏领域大放异彩的英伟达 Voyager 智能体、能够帮助个人完成简单任务 的 Agent 助理 HyperWrite、以及主打个人情感陪伴的 AI 助理 Pi 等多款优秀的 Agent 成果,AI Agent 的研究进展迅速。

“Agent+”有望成为未来产品的主流,有望在多个领域实现落地应用。我们认为, AI Agent 的研究是人类不断探索接近 AGI 的过程,随着 Agent 变得越来越“可用” 和“好用”,“Agent+”的产品将会越来越多,未来将有望成为 AI 应用层的基本架 构,包括 to C、to B 产品等。

2B 和垂直领域仍是 AI Agents 容易率先落地的方向,用户对 Agent 的认知正在形 成,初创企业正在卡位。由于 Agent 对环境反馈的依赖性较强,具备显著特点的企 业环境是更加适合 Agent 建立起对某一个垂直领域认知的场景。当前关于 AI Agent 的研究主要还是以学术界和开发者为主,商业化产品极少,但是用户对于 Agent 的 关注度正在提升,可能未来几年间就会涌现出大量以 Agent 作为核心的产品应用到 各行各业。目前,已经有一些初创公司开始以企业的智能体平台作为主要的产品研 发方向,例如澜码科技正在打造基于 LLM 的企业级 Agent 平台。

成为VIP会员查看完整内容
73

 模型、算力、生态推动AI应用进入大爆发时代:   1)算法及模型的快速进步:2017年Transformer模型及2022年ChatGPT的发布标志着生成式AI在文本领域的重大飞跃,并在多项能力上超越了人类基准,未来随着更强大的语言大模型(如GPT-5),以及多模态生态和视觉大模型的技术持续突破,将推动AI应用的持续进化。   2)算力基础设施将更快、更便宜:虽然短期内大模型训练需求的激增推高了算力成本,但随着英伟达GPU性能的持续升级,以及微软、亚马逊、谷歌和Facebook等巨头正在加大对AI算力云服务的资本开支,并积极布局自研A芯片,未来AI算力将更快、更便宜,以更好的支撑应用层的快速发展。   3)AI生态的逐渐成熟:AI组件层(AIStack)的完善和产业分工细化,为A应用在模型训练、数据整合、应用开发、应用部署等环节提供全生命周期的支撑。   全球科技股复盘:算力基础设施层公司率先受益于本轮AI产业浪潮,应用层公司同样有所演绎,从兑现节奏上晚于基础设施层。在基础设施层中,英伟达是AI“掘金买铲”逻辑的核心受益者,其次为微软、Google、AWS、Oracle等头部云服务厂商和大模型厂商。在应用层中,美股年初至今涨幅靠前的AI应用公司有:Palantir(136%)、Duolingo(109%)、Shopify(92%)、PaloAltoNetworks(74%)、Salesforce(67%)、adobe(67%)、ServiceNow(52%)。相较于AI基础设施厂商已经能够从模型训练所产生的巨大需求,订单和业绩也得到了持续验证,B端应用还处于早期,大多数AI应用厂商还尚未进入到商业化阶段,从兑现时间来看预计要晚于基础设施层2-3个季度。   全球生成式AI项目及投融资现状:   1)AI项目数量激增:GitHub上AI开源项目截止8月底数量达到了91万,相较于去年全年的增幅达到264%。根据Replit的数据,23年二季度AI项目环比增速达80%,相较于去年同期同比增长了34倍;   2)OpenAI在大模型上依然具备统治级地位:95%以上的应用项目均是基于OpenAI的模型来构建,同时开源项目数量也开始大幅增长;   3)2023年是生成式AI投融资创纪录的年份:根据CBInsights的数据,截至2023年第二季度,生成式AI的投融资相较于去年全年的25亿美元,增长了4.6倍;   4)生成式AI应用层融资金融仅占三成:目前约七成资金投向了包括大模型开发在内AI基础设施层。而从应用层的融资中,AI数字代理获得融资最多,其次为文本、图像、代码及音频的生成工具。   生成式AI应用按应用领域可以分为工具型应用、通用软件、行业软件、智能硬件四大类,从产品形态上将沿着AIGC(内容生成)、Copilot(智能助手)、Insight(知识洞察)、Agent(数字代理)四个重要的方向演进。   1)工具型应用:包括聊天机器人、搜索引擎、文本工具、AI作画以及代码工具等,主要集中在C端,产品的同质化程度较高,对于大多数文本、图像、视频、代码、3D模型等AIGC工具,模型/算法的能力决定了产品的受欢迎程度,对底层模型特别是GPT-4存在高度依赖。目前行业进入第一轮洗牌期,竞争优势的构建来自于差异化的产品定位以及持续训练更强大的底层模型和算法。   2)通用软件:包括办公软件、企业服务、IT运维、软件开发、网络安全、数据智能等领域,各领域头部厂商均已出现标杆产品,最常见的产品形态主要是AI智能助理(Coplilot),代表有Office365Copilot、SalesforceEinsteinGPT及AdobeFirefly。目前各个赛道竞争格局变化不大,各个赛道的龙头厂商依然率先受益于生成式AI所创造的新的产品功能,未来的竞争关键在于AI与场景/工作流的深度融合,目前通用软件头部厂商预计将在四季度进入商业化落地的关键阶段;   3)行业软件:涉及金融、医疗、教育、工业、游戏、法律等多个行业,生成式AI在游戏、法律、教育、电商等C端场景有较多的结合,而在医疗、金融、工业等B端场景下生成式AI产品的成熟度仍然偏低。AI助手(Copilot)同样得到了广泛应用,而未来在金融、医疗、工业等领域,最具前景的应用来自于数据分析和知识洞察(Insight)工具。同时,目前各行业头部厂商也在开始自建垂类大模型,包括彭博社的金融大模型Bloomberg,以及Meta蛋白质大模型ESMFold,当前垂类大模型在其专业领域的性能普遍超过通用大模型。   4)智能硬件:包括智能汽车、机器人、智能终端等,目前生产式AI与智能硬件的结合主要分为两个方面:一是语音助手,应用场景包括智能座舱、智能音箱、家用机器人等各类智能终端,相较于过去的语音交互模式,大模型和生成式AI技术提升了感知和生成能力,进而带来了用户体验的提升,但是总体而言产品门槛相对较低,另一类则为数字代理AIAgent,主要应用包括自动驾驶、智能机器人等,具备更加广阔的应用空间。目前AIAgent在感知与决策能力上仍存在瓶颈,未来应用空间打开的关键在计算机视觉、具身智能等底层技术的突破。   生成式AI产品目前的商业模式主要包括功能订阅、按量付费、产品销售等,其中C端应用以功能订阅和按量付费为主,商业化已经趋于成熟,而B端应用则主要为功能订阅、解决方案和产品销售,即将进入全面商业化阶段。目前第一批生成式AI应用包括JasperAI、NotionAI、MidJourney等均已经成功实现商业化。其中Office365Copilot的定价为每个用户30美元/月。相较于Office主线产品15-30美元/月的定价,最高提升了2倍以上。Salesforce的生成式AI模块服务GPT和销售GPT分别单用户每月付费为50美元。此外,Palantir、PaloAltoNetworks的AI产品已经在实际场景中得到应用且已经带来了明显的收入贡献,四季度AI应用将正式进入商业化落地阶段。

成为VIP会员查看完整内容
79

AI Agents是最近热议的焦点,OpenAI AI的应用研究主管Lilian Weng发布了一篇关于AI Agents的万字长文:《大语言模型(LLM)支持的自主代理》引起了行业的热议,在文章中,她清晰地定义了基于LLM构建AI Agents的应用框架:Agent=LLM(大型语言模型)+记忆(Memory)+规划技能(Planning)+工具使用(Tool Use),其中,LLM是智能体的大脑,而其它几个部分,是关键的组件。而最近复旦大学自然语言处理组《大模型智能体》综述论文,提出了一个基于LLM的智能体的概念框架,包括三个主要组成部分大脑、感知和行动,非常值得关注!

长期以来,人类一直在追求与人类水平相当或超越的人工智能(AI),认为AI智能体是实现这一目标的有前景的工具。AI智能体是能感知环境、做出决策并采取行动的人造实体。自20世纪中叶以来,已经做出了许多努力以发展智能的AI智能体。然而,这些努力主要集中在算法或训练策略的进步上,以提高在特定任务上的特定能力或性能。实际上,这个领域缺乏的是一个足够通用和强大的模型,作为设计能适应多样化场景的AI智能体的起点。由于它们展示出的多功能和出色的能力,大型语言模型(LLMs)被认为是通用人工智能(AGI)的潜在媒介,为构建通用AI智能体提供了希望。许多研究努力已经以LLMs为基础来构建AI智能体,并取得了显著进展。我们首先从其哲学起源追溯智能体的概念,到其在AI中的发展,并解释为什么LLMs是适合作为AI智能体的基础。在此基础上,我们提出了一个基于LLM的智能体的概念框架,包括三个主要组成部分大脑、感知和行动,该框架可以根据不同的应用进行定制。随后,我们探讨了基于LLM的智能体在三个方面的广泛应用:单智能体场景、多智能体场景和人-智能体合作。接下来,我们深入研究智能体社会,探讨基于LLM的智能体的行为和个性,当它们形成社会时出现的社会现象,以及它们为人类社会提供的洞见。最后,我们讨论该领域内的一系列关键主题和未解决的问题。

人工智能(AI)是一个致力于设计和开发能复制人类智能和能力的系统的领域[1]。早在18世纪,哲学家丹尼斯·狄德罗(Denis Diderot)提出了这样一个观点:如果一只鹦鹉能回应所有问题,那么它可以被认为是智能的[2]。虽然狄德罗指的是像鹦鹉这样的生物,但他的观点强调了一个深刻的概念,即高度智能的生物可能与人类智能相似。到了20世纪50年代,艾伦·图灵(Alan Turing)将这一概念扩展到了人工实体,并提出了著名的图灵测试(Turing Test)[3]。这个测试是AI的基石,旨在探究机器是否能展示与人类相当的智能行为。这些AI实体通常被称为“智能体”,是AI系统的基础构件。在AI中,智能体通常指的是能使用传感器感知其环境、做出决策,然后使用执行器作出反应的人工实体[1; 4]。

智能体这一概念起源于哲学,其根源可追溯到亚里士多德和休谟等思想家[5]。它描述了拥有欲望、信仰、意图和采取行动能力的实体[5]。这个想法转变到了计算机科学中,旨在使计算机能理解用户的兴趣并自主地代表他们采取行动[6; 7; 8]。随着AI的发展, “智能体”这个术语在AI研究中找到了其位置,用以描述展示智能行为并具有自主性、反应性、主动性和社会能力等特质的实体[4; 9]。从那时起,智能体的探索和技术进步成为AI社群关注的焦点[1; 10]。现在,AI智能体被认为是实现通用人工智能(AGI)的重要步骤,因为它们包含了广泛的智能活动的潜力[4; 11; 12]。

从20世纪中期开始,在发展智能AI智能体方面取得了显著进展,因为研究深入探讨了它们的设计和提升[13; 14; 15; 16; 17; 18]。然而,这些努力主要集中在提高特定能力上,如符号推理,或者掌握特定任务,如围棋或国际象棋[19; 20; 21]。在不同场景中实现广泛的适应性依然难以捉摸。此外,先前的研究更多地强调算法和训练策略的设计,而忽视了模型固有通用能力的发展,如知识记忆、长期规划、有效泛化和有效交互[22; 23]。实际上,增强模型的固有能力是智能体进一步发展的关键因素,该领域需要一个具备上述多种关键属性的强大基础模型,作为智能体系统的起点。

大型语言模型(LLMs)的发展为智能体的进一步发展带来了一线希望[24; 25; 26],并且社群已经取得了显著进展[22; 27; 28; 29]。根据“世界范围(World Scope,WS)”的概念[30],该概念涵盖了从自然语言处理(NLP)到通用AI的五个层次(即,语料库、互联网、感知、具象和社交),纯粹的LLMs是建立在第二层,具有互联网规模的文本输入和输出。尽管如此,LLMs在知识获取、指令理解、泛化、规划和推理方面展示了强大的能力,同时与人类进行有效的自然语言交互。这些优势赋予了LLMs作为通用人工智能(AGI)的媒介的称号[31],使它们非常适合用于构建智能体,以促进一个人类与智能体和谐共存的世界[22]。从这一点出发,如果我们提升LLMs到智能体的地位,并赋予它们更广泛的感知空间和行动空间,它们有可能达到WS的第三和第四层次。此外,这些基于LLMs的智能体可以通过合作或竞争来解决更复杂的任务,当将它们放在一起时,可以观察到新出现的社会现象,从而可能达到第五个WS层次。如图1所示,我们设想一个由AI智能体组成的和谐社会,人类也可以参与其中。

在本文中,我们提出了一个全面和系统的调查,重点关注基于大型语言模型(LLM)的智能体,试图研究这个新兴领域的现有研究和前景途径。为此,我们首先深入探讨关键的背景信息(第2部分)。具体来说,我们从哲学到人工智能(AI)领域追溯AI智能体的起源,并简要概述围绕人工智能体存在的争论(第2.1部分)。接下来,我们通过技术趋势的视角提供了AI智能体发展的简明历史回顾(第2.2部分)。最后,我们深入介绍智能体的基本特性,并阐明为什么大型语言模型非常适合作为AI智能体的大脑或控制器的主要组成部分(第2.3部分)。

受到“智能体”定义的启发,我们为基于大型语言模型(LLM)的智能体提出了一个具有三个关键部分的通用概念框架:大脑、感知和行动(第3部分),该框架可以定制以适应不同的应用场景。我们首先介绍大脑,主要由一个大型语言模型组成(第3.1部分)。与人类相似,大脑是AI智能体的核心,因为它不仅储存了关键的记忆、信息和知识,而且还承担了信息处理、决策、推理和规划等基本任务。这是智能体能否展示智能行为的关键决定因素。接下来,我们介绍感知模块(第3.2部分)。对于智能体而言,这个模块的作用与人类的感官器官类似。它的主要功能是将智能体的感知空间从仅限于文本扩展到一个包括文本、声音、视觉、触觉、嗅觉等多种感官模态的多模态空间。这种扩展使智能体能够更好地从外部环境中获取信息。最后,我们介绍用于扩展智能体行动空间的行动模块(第3.3部分)。具体而言,我们希望智能体能够拥有文本输出,进行实体化的行动,并使用工具,以便它能更好地响应环境变化,提供反馈,甚至改变和塑造环境。

然后,我们提供了基于大型语言模型的智能体的实用应用的详细而全面的介绍,并阐明了基础设计追求——“为了公益而驾驭AI”(第4部分)。首先,我们深入研究单一智能体的当前应用,并讨论它们在基于文本的任务和模拟探索环境中的表现,重点介绍它们在处理特定任务、推动创新以及展示类似人类的生存技能和适应性方面的能力(第4.1部分)。接下来,我们回顾了多智能体发展历史。我们介绍了基于LLM的多智能体系统应用中智能体之间的互动,其中它们参与合作、谈判或竞争。无论互动模式如何,智能体都共同努力实现共享目标(第4.2部分)。最后,考虑到基于LLM的智能体在隐私安全、道德约束和数据不足等方面可能存在的局限性,我们讨论了人-智能体合作。我们总结了智能体与人之间合作的范例:指导者-执行者范例和平等合作范例,以及具体的实践应用(第4.3部分)。

基于对基于大型语言模型(LLM)的智能体在实际应用中的探索,我们现在将焦点转向“智能体社会”的概念,研究智能体与其周围环境之间的复杂相互作用(§ 5)。本节首先调查这些智能体是否表现出类人行为并具有相应的个性(§5.1)。此外,我们介绍智能体所操作的社交环境,包括基于文本的环境、虚拟沙盒和物理世界(§5.2)。与前一节(§ 3.2)不同,这里我们将关注多种类型的环境,而非智能体如何感知它。在建立了智能体和他们环境的基础之后,我们继续揭示他们形成的模拟社会(§5.3)。我们将讨论模拟社会的构建,并进一步研究其中出现的社会现象。具体来说,我们将强调模拟社会中固有的教训和潜在风险。

最后,我们讨论了基于大型语言模型的智能体领域的一系列关键主题和未解决的问题(§ 6):(1)LLM研究和智能体研究的相互益处和灵感,其中我们展示了基于LLM的智能体的发展为智能体和LLM社群提供了许多机会(§ 6.1);(2)现有的评估工作以及从四个维度对基于LLM的智能体的一些前景,包括实用性、社交性、价值观和持续演化的能力(§ 6.2);(3)基于LLM的智能体的潜在风险,我们讨论了基于LLM的智能体的对抗性鲁棒性和可信度。我们还包括了其他风险的讨论,如滥用、失业和对人类福祉的威胁(§ 6.3);(4)扩大智能体数量,我们讨论了扩大智能体数量的潜在优点和挑战,以及静态和动态扩展的方法(§ 6.4);(5)几个未解决的问题,例如关于基于LLM的智能体是否代表通往AGI(人工通用智能)的潜在途径的争论,从虚拟模拟环境到物理环境的挑战,AI智能体中的集体智能,以及智能体作为一项服务(§ 6.5)。总之,我们希望本文能给相关领域的研究人员和从业者带来启发。

智能体的诞生:基于大型语言模型(LLM)的智能体构建

“适者生存”[131]表明,如果一个个体想在外部环境中生存,他必须有效地适应周围环境。这要求他具有认知能力,能够感知和响应外界的变化,这与第2.1节中提到的“智能体”的定义是一致的。受此启发,我们提出了一个基于大型语言模型(LLM)的智能体的一般概念框架,该框架由三个关键部分组成:大脑、感知和行动(见图2)。我们首先描述大脑的结构和工作机制,它主要由一个大型语言模型组成(§ 3.1)。大脑是AI智能体的核心,因为它不仅储存了知识和记忆,而且还承担了信息处理和决策等不可或缺的功能。它可以呈现推理和规划的过程,并且能够很好地应对未见过的任务,展现出智能体的智能。接下来,我们介绍感知模块(§ 3.2)。其核心目的是将智能体的感知空间从仅限于文本的领域扩展到包括文本、听觉和视觉模式的多模态范围。这一扩展使智能体能更有效地掌握和利用来自其周围环境的信息。最后,我们介绍了旨在扩展智能体行动空间的行动模块(§ 3.3)。具体来说,我们赋予智能体具体的行动能力和使用工具的技能,使其能够熟练地适应环境变化,提供反馈,甚至影响和塑造环境。

该框架可以针对不同的应用场景进行定制,即并非所有研究中都会使用每一个特定组件。一般来说,智能体按照以下工作流程进行操作:首先,感知模块,相当于人类的感官系统如眼睛和耳朵,感知外部环境的变化,然后将多模态信息转换为智能体能理解的表示形式。随后,作为控制中心的大脑模块进行信息处理活动,例如思考、决策以及与存储(包括记忆和知识)相关的操作。最后,与人类四肢相对应的行动模块,在工具的协助下进行执行,并对周围环境产生影响。通过重复以上过程,智能体可以持续地获得反馈并与环境互动。

成为VIP会员查看完整内容
66
继续向下滚动查看精品内容
本周荟萃主题
区块链
区块链(Blockchain)是由节点参与的分布式数据库系统,它的特点是不可更改,不可伪造,也可以将其理解为账簿系统(ledger)。它是比特币的一个重要概念,完整比特币区块链的副本,记录了其代币(token)的每一笔交易。通过这些信息,我们可以找到每一个地址,在历史上任何一点所拥有的价值。
深度学习
机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。
机器学习
“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。”

——中文维基百科
强化学习
强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。
推荐系统
推荐系统,是指根据用户的习惯、偏好或兴趣,从不断到来的大规模信息中识别满足用户兴趣的信息的过程。推荐推荐任务中的信息往往称为物品(Item)。根据具体应用背景的不同,这些物品可以是新闻、电影、音乐、广告、商品等各种对象。推荐系统利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。
卷积神经网络
在深度学习中,卷积神经网络(CNN或ConvNet)是一类深度神经网络,最常用于分析视觉图像。基于它们的共享权重架构和平移不变性特征,它们也被称为位移不变或空间不变的人工神经网络(SIANN)。它们在图像和视频识别,推荐系统,图像分类,医学图像分析,自然语言处理,和财务时间序列中都有应用。
计算机网络
计算机网络( Computer Networks )指将地理位置不同的多台计算机及其外部设备,通过通信线路连接起来,在网络操作系统及网络通信协议的管理和协调下,实现资源共享和信息传递的计算机系统。
命名实体识别
命名实体识别(NER)(也称为实体标识,实体组块和实体提取)是信息抽取的子任务,旨在将非结构化文本中提到的命名实体定位和分类为预定义类别,例如人员姓名、地名、机构名、专有名词等。
机器翻译
机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。
计算机视觉
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。
微信扫码咨询专知VIP会员