1、政务系统接入DeepSeek主题研讨材料汇编(4篇)目录L从DeepSeek看科技创新企业的培育22 .从DeepSeek看人工智能自主创新的战略价值63 .谁将取代DeepSeek对DeePSeek的冷思考104 .关于DeepSeek融入机关工作的几点思考265 .政务系统接入DeepSeek几个问题不容忽视316 .AI时代,诗歌何去何从35从DeePSeek看科技创新企业的培育近期,源自中国的现象级科创企业DeePSeek在全球引起巨大轰动和深远影响,为中国科技创业从赶超迈进引领舞台提供了示范榜样,提振了广大中国科技创业者的信心。社会各界在热切思考,中国缘何可以孕育出DeePSeek这
2、样的优秀企业?一些拥有科技、人才等丰沃要素禀赋的城市甚至在反思为何出不来DeepSeek0中国和世界需要努力培育出更多的DeePSeek型科创企业,以激发创新活力、助推经济发展和增进社会福祉。加快培育具有科学家精神特质的企业家。在科技创业活动中,企业家精神是推动成功的基本动力,其核心在于创新驱动、风险承担与前瞻布局。而科学家精神强调尊重科学知识和规律,重视基础研究及原理性学习。在追赶阶段,创业者大多采取模仿创新和跟随战略,在既有的技术范式和市场路线下开展创新创业活动,有机会取得一定的商业成功和社会贡献。但当步入引领阶段,面对标杆稀缺、自主创新需求激增、风险和不确定性加大的情境,这两种精神的结合
3、就变得尤为关键。与此同时,在未知的前沿领域盲目探寻会徒增失败概率,更需要创业者尊重科学知识和规律,科学驱动的创新创业的重要性日益提升。企业家不仅需要丰富商业知识,还需要养成厚实的科学精神,注重学习基础性和原理性知识,以科学的第一性原理来指导和组织创新创业活动。与注重技术应用的创业活动不同,科学驱动型创业要求创业者高度重视基础研究,而基础研究取得进展无法一蹴而就,需要创业团队敢于投入、勇于冒险、甘于寂寞、持之以恒地逐步推进。DeepSeek等优秀科创企业的创业者多接受过科学知识的学习和基础研究的训练,为其接续探寻科学进展并指导创业活动打下了扎实的基础。为此,需要采取以下措施。一是完善科技、教育、
4、人才三位一体体系建设,持续加强基础研究,引导和支持更多青年学子投入科学研究队伍,在学习和训练中不断提升创业者的科学精神和素养,涌现出更多科学驱动的创业实践活动;二是引导和支持创业者加大基础性和前沿性研发创新投入,注重与领域内高水平人才和机构加强科研合作,遵循科学知识持续深耕细分领域,奋力攻克关键核心技术;三是提炼总结和宣传推广具有科学家精神特质的优秀企业家案例,激励更多创业者扎根难而正确的科技创业活动。持续打造更高能级的产业链创新链。产业链和创新链是科技创业活动高效开展的关键支撑。绝大多数科技创业活动定位于产业链和创新链中的某一特定环节或领域。这种“专精特新导向的创业活动,需要与上下游客户和供
5、应商协同发展,也需要衔接融合应用相关的科技成果。在追赶阶段,创业活动对原材料、零部件以及科技知识的要求总体不高,现有产业链和创新链可以提供有效支撑。但在引领阶段,科学驱动型创业活动对上下游合作伙伴、科研院校等知识源提出了较高的要求,需要有更高能级的产业链创新链才能匹配支持,否则就会极大地约束优质创业项目的成功率。DeePSeek等优秀科创企业的成功,往往需要调动整合利用优质的产业和技术资源,与中国本土乃至全球产业链创新链的有力支持紧密相关,如发达的数字基础设施、优质的软硬件研制等。在一些产业层次较低、科创资源较为薄弱的地区,前沿的科创项目难以得到本地化配套支持,因而陷入“孤岛”式创业,加剧了创
6、业的难度和失败率。在美西方一些国家实施“脱钩断链”的背景下,国家和地方在培育发展科创活动中更需重视本国和本区域产业链创新链的转型升级。一是识别出产业链创新链中的断点堵点,通过内培外引等方式加快强链补链”“拓链“,不断完善链条环节和提升链条水平;二是引导和支持链条各主体强化专业化分工协作,尤其是推动大中小企业融通创新发展,形成共创共促共享的发展格局;三是积极推动先进技术的场景开放和创新,让前沿技术有更多的试错迭代和推动应用的机会,助力技术和市场更有效地互促发展。建设更具包容性的创新创业生态系统。创新创业生态系统是科技创业活动持续涌现的氛围和土壤。当下很多人在关注DeePSeek、宇树科技、游戏科
7、学等,被称作杭州“六小龙”的新兴科技企业为何会出现在杭州。其中一大原因在于杭州拥有包容性较强的创新创业生态系统。OPenAl的两位人工智能科学家在为什么伟大不能被计划一书中考察了科技发展史,认为对未知的机会秉持开放和灵活的态度、多些包容能够收获更多“意外”的伟大发现,但这并不意味着创业者可以“躺平”,而是要保持持续的“好奇”和不懈的探索。在追赶阶段,创业者有既定的学习追赶榜样,可以参照既有路线有计划地前行。但在引领阶段,创业者站在科技和商业的“无人区”前沿,创业活动更富未知性和探索性,反复迭代和失败再失败往往成为常态,此时需要浸润在包容性强的创新创业生态中才能接续探索。可从以下几方面建设更具包
8、容性的创新创业生态系统。一是营造宽容失败的文化,认识到失败也是一种宝贵的财富,为创业失败者提供更多的精神和物质支持,鼓励连续创业,持续激活创业活力;二是减少对创业活动的“过度”关爱,在坚守法律和道德等原则基础上,允许创业者在“无人区自由探索,为创业者针对性地提供赋能型创业服务;三是形成创新创业生态合力,打造出创业者、在位企业、政府部门、科研院校、中介服务机构等多主体合力发展科技事业的共同使命,让科技创业者从“孤军奋战”走向“抱团取暖”。培育更多具有科学家精神特质的企业家,是中国持续涌现出世界影响力的科技领军企业的基础力量。打造高能级的产业链创新链,可以为广大科技创业者在创新突破、降本增效等活动
9、中提供坚实的保障。包容性强的创新创业生态,则犹如我们每日呼吸的新鲜空气,润物细无声,成为科技创业者最喜好的阳光雨露。从DeepSeek看人工智能自主创新的战略价值随着全球科技竞争的加剧,人工智能已成为国家竞争力的重要标志。无论是国家还是行业、个人,都在积极探索如何利用人工智能赋能发展、推动产业升级和产品创新,以及个人职业发展。今年年初,DeepSeek推出的DeePSeek-Rl大语言模型,在有限资源投入下达到了国际领先水平,标志着中国Al技术自主创新的重大突破。这不仅推动了业界对大模型研发模式的重新思考,也引发了国际市场对中国Al产业发展前景的高度关注。事实上,DeepSeek-Rl的出现只
10、是中国AI自主创新的一个缩影,在追求高水平科技自立自强已成为国家战略共识的背景下,如何围绕人工智能构建自主可控、开放协同的发展格局,才是更为关键的命题。DeepSeek-Rl最引人注目之处在于其对模型训练方式的优化,不同于常见的依赖大规模算力和高投入的方式,该模型强调算法与算力的协同设计,在蒸僧算法、数据筛选和算力调度上进行了多项改进,并取得了与部分国际先进大模型相近的应用效果。这种“以巧取胜的策略为正在探索大模型商业化和场景落地的市场提供了新的思路:即便在不占有绝对资源优势的条件下,通过底层技术和研发思路的不断创新,同样能够跻身国际前沿。此外,DeePSeek在一定范围内开放和共享相关研究成
11、果,表明国内AI产业对开源协作的重视度不断提升,若企业在关键技术上具备更多自主权,又能积极融入开源社区、联合产业链伙伴打造应用生态,那么无论是在模型进化还是在产业应用层面,都可能形成稳健的迭代机制。对于中国AI的整体发展而言,通过多元合作和数据要素的高效流动,加快技术成熟与行业落地,既能够降低研发成本,也有助于推动各行各业尽快享受智能化带来的效益。近年来,国内对人工智能领域的投入不断增加,一些科研机构和企业在语音识别、计算机视觉、自然语言处理等领域取得了显著成果。国家出台的新一代人工智能发展规划及各类产业扶持政策,促进了核心技术突破和跨界应用,营造了多元主体共同探索、区域协同发展的良好环境。随
12、着新一轮科技革命和产业变革的加速,人工智能已成为推动数字经济和制造业升级、智慧城市建设以及社会治理创新的重要动力,展现出广泛的应用前景。我国庞大的市场规模和多样化的应用场景,为Al研发和产业化提供了得天独厚的优势,包括海量数据、丰富的行业需求和完善的供应链基础等,这些要素共同为企业技术迭代和商业模式验证创造了良好条件。在看到机遇的同时,必须承认我们在一些关键核心技术领域仍存在一定短板。当前,全球AI产业链呈现高度分工格局,高端芯片及其制程、基础软件平台等领域在国际范围内的竞争日益激烈,一些国家还对我国科技企业采取了程度不等的限制措施。在这种背景下,能否掌握更多具有自主知识产权的核心技术,直接影
13、响着我国在未来产业生态中的地位和韧性。更进一步说,人工智能正在引发的数据权益、伦理规范、国际竞争规则的深层变革,同样离不开自主创新与开放协作并重的发展理念。只有在底层技术拥有一定主导权的同时,持续提升对外合作水平,才能既保障自身发展安全,也能为全球科技共同进步贡献更多中国方案。因此,我们需要从更宏观的角度深入思考并实践加速人工智能自主创新的路径,为我国的人工智能领域持续注入发展动能。首先,进一步鼓励面向核心技术的联合攻关。我国幅员辽阔,区域发展层次丰富,高校、科研院所和产业界对人工智能具有多元需求和科研动能。通过完善产学研结合机制,让更多团队专注在大模型、智能芯片、操作系统等基础层面开展长期研
14、究。国家可以借助重大专项、重点实验室、行业联盟等方式,持续为底层技术的冲关提供政策与资金支持。其次,着力培养和吸引高水平人才。人工智能的竞争归根结底是人才的竞争。可以通过提高科研岗位吸引力、优化人才评价体系、加强国际学术交流等多种手段,为顶尖创新力量提供良好的学术环境和配套条件。在此基础上,积极培育跨学科、跨行业的复合型队伍,满足Al产业在技术落地、产品设计、市场运营等各个环节的多层次需求。再次,大力推进人工智能与实体经济的深度融合。我国在工业制造、物流运输、医疗教育等领域都有巨大的智能化改造空间。若能在这些典型场景中率先实现规模化应用,不仅能快速验证技术成果,也能推动企业降本增效,提高行业整
15、体数字化水平。这种“以用促研”的路径已在多个细分领域展现出积极成效,值得在更大范围内推广实践。最后,在坚持自主可控的前提下,不断拓展国际合作与规则对话。人工智能是一门全球性、开放性的科学,没有任何国家或企业能够单打独斗。从开源社区共建到跨国企业合作、从国际标准讨论到多边治理协商,都需要我国在掌握核心技术的同时积极参与,为自身争取更大的话语权和发展机遇。尤其在数据安全、算法伦理和知识产权等关键问题上,亟须形成一套既具国际特点又兼顾本土实际的规范体系。总之,人工智能的发展已步入新阶段,技术迭代加速,商业应用和社会影响迅速扩展。我国在政策和产业层面的长期布局,为AI自主创新奠定了坚实基础。DeepS
16、eek-Rl的成功展示了国内企业在前沿领域的突破潜力,坚定了我们推进高水平科技自立自强的信心。未来,通过聚焦关键技术攻关、完善人才体系、推动行业应用落地以及积极参与国际合作,我国完全能够在新一轮科技革命和产业变革中赢得更大主动权,为构建开放、包容、互利共赢的全球创新生态贡献更多力量。谁将取代DeepSeek对DeepSeek的冷思考一、DeePSeek的一般情况(一)DeePSeek是谁DeepSeek成立于2023年,公司位于中国杭州,由前对冲基金幻方(High-FlyerQuant)的领导者梁文峰创立。DeepSeek的主要特点是基于开源模型和提供低推理成本的技术。DeePSeek聚集了一
17、支年轻、技术技能出色的团队,其核心目标是推动通用人工智能(AGI),并以透明和开源的方式进行研究,同时强调通过低成本的技术使先进的人工智能(AI)更容易获取。(二)DeepSeek的成就DeepSeek在模型开发上采用了混合专家架构(MOE)等先进算法,这有助于节省显存资源,并提高底层算力的使用效率。这种技术思路在DeepSeek-V2中已经得到验证。公司通过开源其模型和相关技术,允许更多的AI团队基于这些最先进且成本最低的技术开发新的应用。DeepSeek-Rl是公司推出的一款模型,在短时间内登顶苹果美国区应用商店免费APP下载排行榜,并在中国区也取得了领先的位置。该模型在多个领域(如文本创
18、作、代码生成等)达到了与OPenAl相当的水平,但成本仅为OPenAl模型费用的一小部分。DeepSeek的突出功能之一是其令人难以置信的非常低的APl调用价格,使高级Al更容易访问。例如,DeepSeek-Rl的起价每百万输入Token为0.55美元、每百万输出Token为2.19美元,这一价格远低于OPenAl或其他美国AI实验室的产品。(三)DeepSeek引起的市场轰动DeepSeek的成功可能会促使C)PenAl和其他美国供应商降价以保持现有的领先地位。如果更高效的模型能够以少得多的支出参与竞争,那么人们就会质疑Meta和微软等公司的巨额支出,他们分别承诺在2025年将至少650亿美
19、元主要投入在AI基础设施上这一资本支出。DeePSeek在全球市场掀起风浪,阿斯麦、英伟达等之前受益于AI服务需求欣欣向荣的股票大跌,而科大讯飞等与DeepSeek相关的中国股票则出现上涨。1月27日,纳斯达克100指数期货跌幅扩大至5%,标普500指数期货下跌3%。欧洲方面,科技股领跌,芯片设备制造商阿斯麦控股下跌11%,Cboe波动率指数(VIX)走高。如果此番跌势维持,纳斯达克100和欧洲斯托克600科技股指数所蒸发的市值总额将达大约L2万亿美元。“DeepSeek的成功显示出开发成本较低的强大AI模型是可能的,*瑞士联合私立银行(UniOnBanCairePriVee)董事总经理Vey
20、SernLing表示,“这可能会冲击目前由少数科技巨头高额支出来驱动整个Al供应链的投资逻辑。”(四)DeepSeek的创新DeepSeek-V3和DeepSeek-Rl都利用了混合专家架构(MoE),该架构仅激活其6710亿个参数中的一个子集。可以把它想象成部署数百名专业的微观专家,在需要他们的技能时介入。这种设计确保了计算效率,同时保持了高模型质量。DeePSeek采用纯强化学习(RL)方法,进一步使其与众不同。这些模型通过连续的反馈回路自主学习和改进,实现自我校正和适应性,这种机制显著提高了其解决问题的能力,特别是对于需要深入推理和逻辑分析的任务。除了MoE,多头潜在注意力机制(MLA
21、)提高了模型同时处理多个数据流的能力。通过将焦点分布在几个“注意力”头上,可以更好地识别上下文关系并处理细微的输入,即使在处理单个请求中的数万个Token时也是如此。(五)用户评价用户对DeePSeek-Rl的高度评价主要集中在其思考过程的细腻性、自洽性和全面性上,它能够提供深度和细节丰富的输出。一些用户也指出了DeepSeek在某些方面的“用力过猛”,如生成过于复杂的语言或不适当的用词,特别是针对特定受众(如儿童)的内容。DeepSeek面临的技术挑战包括如何进一步优化模型的性能、降低成本的同时保持高效率,以及克服可能存在的幻觉和偏差问题。DeepSeek公司正在专注于增强其“DeepThi
22、nk+Web”搜索的功能,以实现实时在线查找能力。此外,还考虑开发针对特定行业的定制化模型,以及建立全球合作伙伴关系。、关于DeePSeek影响的分析与DeepSeek基本信息相对的,是其所产生的巨大影响。这些影响中有哪些是短期性的,哪些可能是长期性的?(一)对中美战略竞争的影响:“星际之门计划DeepSeek对中美战略竞争的影响,首先表现在对美国星际之门计划(theStargateproject)的影响。2025年1月22日,美国总统特朗普在白宫新闻发布会上宣布启动“星际之门”计划。这一计划被称为“21世纪Al时代的,星球大战,计划”。“星际之门”计划由软银、OpenAL甲骨文等科技巨头联合
23、推动,注资高达5000亿美元。该计划旨在建设先进的数据中心和配套基础设施,以支持人工智能技术的快速发展,预计在未来四年内完成。DeepSeek出现后,一个显而易见的疑问是美国耗费5000亿美元的计划所完成的工作。中国人难道不能用500亿美元甚至更低的成本完成,乃至做得更好吗?这样一来,“星际之门计划还有意义吗?因此特朗普评价道,DeepSeek的问世是一记“警钟”。DeepSeek对“星际之门计划的影响主要体现在技术竞争、市场情绪、政策与战略调整等方面。首先,技术竞争方面,DeePSeek凭借其低成本、高性能的技术优势,给AI行业带来了新的竞争格局。“星际之门”计划的参与者可能会重新评估投资策
24、略和技术方向,思考是否有更高效低成本的方式实现目标。例如,原本计划大量投入算力资源的企业可能会因DeePSeek的出现而调整策略,这增加了美国在人工智能领域的技术竞争压力。其次,市场情绪方面,DeePSeek的发展吸引了市场的关注,使得投资者对高成本AI相关项目产生了怀疑。DeepSeek的市场预期和成本估值,会吸引更多投资者关注。最后,政策与战略调整方面,DeePSeek的成功表明中国科研团队在有限条件下通过创新实现了弯道超车,这可能会促使美国政府重新评估“星际之门”计划的可行性和成本效益,进行政策与战略上的调整。此外,抛开成本不说,马斯克质疑“星际之门”计划的融资情况。这一计划似乎没有与马
25、斯克很好沟通。马斯克在社交平台发文说,“他们实际上没有钱”“软银能确保的资金远低于100亿美元”。这是暗指软银去年负债3.8万亿日元。马斯克还曾表示他不信任OpenAI的奥特曼。美国外交政策(FOreignPoIiCy)上的文章DeepSeek揭示了美中竞争的未来(WhatDeepseekrevealedaboutthefutureofU.S.-Chinacompetition)指出,DeepSeek的非凡成功引发了美国国家安全界的担忧,他们担心美国最先进的AI产品可能再也无法与中国更廉价的替代品竞争。文章分析,美国一直在利用其对半导体供应链的控制,限制中国获取高端芯片。然而,DeePSeek
26、取得的成功让一些人开始质疑,美国的芯片出口管制是否毫无作用,甚至适得其反。文章最后指出,如果美国和中国的AI模型都存在双方不确定如何控制的危险能力的风险,那么美国与中国领导层就此进行沟通则是国家安全的当务之急1。(二)对中美科技竞争的影响DeePSeek的问世,在科技界眼中,缩短了中美在Al上的差距。Meta创始人兼CEO扎克伯格表示,DeepSeek非常先进,并认为中美之间的Al差距非常小。1.1. 仅是中美之争本身,还是开源、闭源之争图灵奖得主、MetaAI首席科学家YannLeCun在社交媒体上表示:DeepSeek的成功凸显了保持AI模型开源的价值,这样任何人都可以从中受益。这表明开源
27、模式正在超越专有模式。”他认为:“当人们看至UDeePSeek的表现,惊呼中国Al正在赶超美国,但这种解读有误。更准确的结论是,开源模型正在超越闭源系统。2福布斯杂志则指出,DeepSeek的开源策略可能重塑全球Al标准,推动中国成为开源模型的主导者之一。自然杂志评价称,Rl的开放性远超闭源模型的“黑匣子”特性。由于美国公司出于商业利益,更倾向闭源系统,这给利用开源系统的中国公司更多机会,特别是在打造科技生态系统方面的机会,而这是以往中国相对于美国的薄弱环节。支持这一看法的事实是,DeepSeek因开放吸引了开发界的热烈响应,很短时间内就衍生出600多个应用。当然,国内科技界也有人对此持怀疑态
28、度,主要是基于以往的开源往往在应用中被当作自主技术保守(伪开源)的历史。DeePSeek目前还没有完全商业化,一旦商业化,将面临如何处理技术开放与商业模式开放的关系的问题。如果处理得好,如将基础业务与增值业务充分分开,形成互补,那么中国在这方面将形成对美国的优势。当然,中国如果在打造包容技术与商业开放的制度环境(如反垄断政策环境)方面落后于美国,也会使技术与商业上的优势化为乌有。2. DeePSeek对巨头的挑战DeePSeek现在俨然具有了当年U盘替代软驱那种“同等功能、巨大价差”的以小博大的势头。DeepSeek的崛起对现有的Al巨头如OpenALMeta等构成了挑战,促使他们重新评估成本
29、战略和研究方法。一是通过开源策略和低成本技术,DeepSeek为小型企业、研究人员和开发者提供了新的机遇。一旦形成良好开发生态,有可能重现当年谷歌取代雅虎的历史。DeePSeek目前已进入搜索技术领域,这要求百度打起十二分的精神来应对,懈怠就意味着出局。二是随着用户采用率的增加和市场对AI能力需求的增长,DeePSeek有望继续在Al领域发挥颠覆性作用。公司可能会进一步优化模型性能、加强与硬件供应商的合作,并开发针对特定行业领域的定制化解决方案。DeepSeek是通过开源技术、低成本策略和创新算法推动人工智能发展的中国初创企业,其成功不仅体现在市场表现上,还在于对Al社区的影响力,以及为小型
30、企业和开发者提供的新机遇。随着未来的发展,DeePSeek有望在Al领域持续产生重大影响,并可能引领下一波变革性突破。同时,也要看到,DeePSeek的出现在中国不是偶然的。中国还有一批潜在的同类技术和公司即将浮出水面,包括阿里团队、李飞飞(华人)团队都已提出了初步的成果,共同推动Al的改朝换代。3. DeePSeek对投资的影响DeePSeek的初步成功,引发了人们对OPenAI、微软和其他公司所追求的投资计划的重大质疑。首先对OPenAl来说,DeepSeek以极低的成本实现极高性能,让人们对OpenAI投资回报能力产生怀疑。将DeepSeek节俭、分散的创新,与OpenAI等其他开发商对
31、集中、资源密集型基础设施的依赖,进行了对比。结果发现,打造一个世界水平Al模型,只需要投入巨头一个高管的年薪就可以做到,巨头动辄养着十几个、几十个这种价位的高管的合理性,就会遭到投资人普遍质疑,甚至会产生受骗的感觉。可以想见,巨头内部现在慌作一团,即使为了保住工资,也有动机赶紧向投资人证明DeepSeek的种种不是。但问题是,如果与DeePSeek类似的小公司成批涌现时,想通过栽赃和甩锅来摆脱困境,将不会有效。当然,有一点现在还看不清楚,这就是DeePSeek本身的资本模式。这家公司出身对冲基金。在DeepSeek这个案例中,对冲基金对AI的投入(包括包装与炒作)是可以看清的;但Al的产出和商
32、业化现在还没有发生,将会怎样,还有待观察。一旦演化成一个金融的故事,就会存在各种变数。从投资上,人们期待DeePSeek做实,而不要变成一个壳。三、谁将取代DeePSeek:从一滴水看Al大海作为专门研究人工智能的业内人士,还要跳出媒体与资本的喧嚣,用平常心冷静观察DeePSeek,这样看出的门道自然有所不同。(一)冷思考之一:DeePSeek是弯道超车还是换道超车?人工智能的权威专家钟义信教授认为,DeepSeek还在传统轨道的同一个赛道上,可以评价为“在同一个赛道上,DeePSeek以更优秀的技术超越了GPTo,o要看到在同一赛道弯道超车的局限。钟义信指出,DeePSeek的技术(主要是算
33、法效率)比GPT更优秀,但是,两者的范式(科学观和方法论)是一样的。具体来说,两者的科学观都是把人工智能看作“人工脑”,两者的方法论都遵循“唯形式化”和“分而治之”。然而,研究人工智能所需要的真正科学观,是应该把人工智能看作“主体主导下的主体客体相互作用的信息生态过程”(即整体论)。这是DeePSeek热中的一种冷思考。钟义信的观点无异于认为,DeePSeek与其追赶的OPenAl是同类,都是美国计算主义同一赛道上的赛手,区别只是一个跑了50步,一个跑了100步。这与一般业内人士的见解(包括马斯克的见解)非常不一样,业内都是看到了开放与封闭路线的区别,看到微软收购OPenAL使得OpenAI变
34、成了一个忘记“初衷”的商业化工具。马斯克的不满很大程度也来自这里,而不是如特朗普认为的与“星际之门”计划中的某人“有仇不过在这里,钟义信进了一步,直指“初衷”本身存在的局限。这涉及对人工智能本质的理解,属于一个更深的问题。现有AI主流坚持物质学科范式(强调客体计算,缺主体价值判断),这是其时代局限。这种局限在DeePSeek骨子里也有。未来取代它的,将是信息学科的范式,即强调客体与主体统一。从这个意义上说,下一步替代DeePSeek们的,将是克服主客二元论的AI新范式,由此开启换道超车。在前沿上,这一趋势的苗头在生成式AI中(如新生成主义,neo-enactivism)隐约可见。本周作出Dee
35、PSeek同类成果的李飞飞,其实就在这条路上,她的野心肯定不止于DeePSeek。(二)冷思考之二:知还是行?著名人工智能专家蔡恒进对DeePSeek的成就有一个独特的看法,认为DeePSeek对巨头的冲击的意义不只在于成本,而在于模式。蔡恒进说:“0PenAl现在走的路,就是把算力集中起来,把参数推上去来实现AGL这实际上是世界的前景就变成很中心化的AI系统,然后这个系统会需要大量的资源、能量,还有芯片算力的集中。而DeePSeek的发展是分布式计算的方向,这比业界一般的“开放-封闭”视野多了一个“集中-分布“角度。蔡恒进同样主张主客一体的AI新范式,不满意计算主义的Al路线,认为“我们有人
36、类或者生命的参与、有主观能动性”,要把这种主体性加入计算的客体性中。他具体提出了“认知坎陷说”,即一种加入布伦塔诺意向性的认知论。对于Al来说,“认知坎陷说”相当于一个“知难行易”模型。目前计算主义把重点放在前者(知难),体现为“AI的进步都是通过规模来实现的”“只有堆算力才是成功的“(李德毅院士称为“暴力计算”)。他从理查德萨顿(RichardS.Sutton)的ThebitterIeSSOr(可译为“苦涩的教训”)一文中,引出对通用算力的质疑。夸奖DeePSeek实际上打破了这个结论已经偏离了那条路线了”,这是指DeepSeek不靠堆GPU而提高性能。蔡恒进主张的新方向,把重点放在后者(行
37、易),相当于认为实践是简、认识是繁。计算主义重认知、轻实践,形成对通用算力和暴力计算的迷信。如果把Al的重点从认识转向实践,知行合一,就可以化繁为简。用他的话说,”并不是说规模越大越好,只是说在它那个场景里才能生成在走偏到客体方向的Al中加入主体因素的方法是,将算法从认识角度调整为实践角度,变为场景的认知、具身的认知,“只是根据场景或需要进行一定程度的数字化这与李飞飞的具身Al思路有相通之处。为此,“追求用更小的数据库、更少的语料、更小的系统来实现更高的智能,在我看来才是正确的方向人们在能行的时候,从不长篇大论,是因为有主体目标、意向在指引,将世界化繁为简到自己的目的上。蔡恒进看好DeePSe
38、ek深度学习的方向,尤其是“不用人干预地强化学习“,但是认为DeePSeek还可以进一步在可持续的自学习这个方向上改进。(三)冷思考之三:向上与向下两条曲线胡延平作为业内资深专家,这轮也没有跟着媒体跑,而是得出了独立的判断。他比较冷静地分析了当前形势,看出大模型的“两条路线”是向上曲线与向下曲线不同取向的分别,认为DeePSeek走在向下曲线的道路上。他说:“大模型现在是两条曲线交织的双螺旋进化。向上走的曲线,追求整体感知理解行为能力的通用智能,拼的是整体理解意义上的脑能力、思考和监督思考、视觉在内的整体理解,空间智能等现实模型、物理等科学模型、多模态更不在话下。思维链、皮层计算、不同模型原理
39、是当下前沿探索的核心。向下走的曲线提升数据质量、训练意义上的量效比、算力能效比,大幅降低推理成本。DeePSeek在这个双螺旋里向下有余向上不足。3广胡延平说:“向下曲线对成本效率有改变,但对捧得AGl圣杯的贡献可以忽略4。”他认为,DeePSeek没有展现分毫对未来的思考和探索,实质上依然处在追赶阶段。DeepSeek不仅属于古典LLM(大语言模型,LargeLanguageModel)范畴,呈现的其实还是“性价比在胡延平看来,DeePSeek主要是对于合成数据、知识蒸镭、FP8低精度(FT8为一种8位浮点数格式)、稀疏模型、MOE,甚至包括多头注意力机制等“已有已知技术”进行组合,“在资源
40、和性能之间调优,取得最佳平衡,这是DeePSeek-V3的成功之处”。当然,对于什么才是值得追求的“AGI圣杯”,仁者见仁,智者见智。(四)不冷不热地思考:高性能计算路线上的两种走法我认为把DeepSeek当作一个事件看,代表的是高性能计算思潮的崛起,从中既反映出DeePSeek的成就所在,也自然显示出其不足。高性能计算是与美国相反的计算路线,在中国形成已有近20年历史。早在上个世纪,国家863计划就开始实施“国家高性能计算环境项目。美国计算主义的路线无以为名,可称为高速度计算。高速度与高性能的不同,反映技术与技术经济的区别。技术不受资源(如GPU)制约时,越快就越好,主要靠上规模、堆硬件实现
41、技术经济在资源约束(从担心系统、芯片“卡脖子”到强调应用)下,强调性价比,一个突出特征是强调成本。打个形象的比方,同为轿车,美国车设计不太考虑省油,是因为石油资源不受限制;而日本车设计主要考虑省油,是因为担心石油哪天被断供。AI也是如此。高性能计算路线在中国有两种走法,一种是弯道超车,另一种是换道超车。DeePSeek代表的是弯道超车的一支,如专家判断的,是在美式路线的既定赛道内,通过强化成本控制,提供高性价比的算力。走这条路,时间在前。DeepSeek只是第一个冒头的,最近五年会是不断开花结果之时。DeepSeek的出现不是偶然的。梁文锋说取得成就是“站在巨人肩膀上”,国内外都误以为巨人是
42、指巨头、大厂,其实不尽然。这个巨人应该说主要是中国科研院校,特别是北大、北邮和清华三校。DeePSeek的140人团队,大多是这三校的应届毕业生。如果没有导师这个群体,以及国家高性能计算环境的近20年打造,梁文锋到哪儿去找那么多博士论文成果,连人带论文都拿来,而且拿来就可以用,用了就可以超过美国巨头。举例来说,DeePSeek的一个窍门是重视模型算法和硬件工程的配合,其中的技术就由这些学生以DeepSeek-AI的名义发表在论文Fire-FlyerAI-HPC:Acost-effectivesoftware-hardwareco-designfordeeplearning中。其中的HPC,就是
43、高性能计算highperformancecomputing的缩写。美国巨头现在总觉得自己才是“巨人”,从DeepSeek这个鸡蛋里挑有没有自己的骨头(研究成果)。这些应届生是站在HPC这个巨人肩膀上成长起来的。其实巨头们找一下DeepSeek中全部应届毕业生的毕业论文,就知道技术是哪里来的了。举例来说,要想了解DeepSeek中不常见的3D生成技术是从哪儿来的,到清华大学检索一下,可得知是清华博士生孙景翔在DeePSeek实习期间,与导师刘烽斌等共同完成的。诸如此类,不胜枚举。高性能计算路线的第二种走法,目前还潜伏在冰山下的大海中,这种走法的特征是换道超车。所谓换道,就是指与美国主流计算主义分
44、道扬镜的路线。最大的不同,在于范式。追的时候是同范式的,超的时候用的是不同范式。范式的不同,涉及的主要是对“科学是什么”的理解有了根本性的分歧。其中的思路,从国家数据空间发展战略中可以看到,目前国家数据空间发展战略正处在二期工程阶段。开花结果,还需要多年以后。应该说,DeePSeek作为中国应届毕业生群体的代表作,还没有进入这个主力赛道。DeepSeek包括马上涌现的大批同行者,作为高性质计算这个大的中国思潮的一部分,只看到LLM成本问题的表层,即与AI物质科学范式有关的那一方面。当然解决了这方面的问题,成就也堪称伟大。但是,再过几年,美国人就会领教中国主力军团的出击,看到冰山一角下庞大的水下
45、部分。那将是一场范式革命,是从目前的客体范式向未来的主客体统一范式转变的伟大长征。我们可以从上面介绍的钟义信、蔡恒进的思想中,从外围体会到其中的潮流上的思路。美国最前卫的科学家也有类似想法,但不成气候。而在中国,这不是一个人两个人的思想,而是代表整个群体走向共识的技术觉醒。关于DeePSeek融入机关H作的几点思考目前,DeepSeek人工智能大模型作为一种新兴的技术,正快步“融入”机关工作。前不久,在郑州“新春第一会”上,省委常委、市委书记安伟提出:“聚焦打造智慧政府、责任政府、法治政府,加快引入DeePSeek等大模型,以AI技术全面植入、全面赋能政务服务,有效提升智能化、精准化、无纸化水
46、平。”为有效推进DeePSeek等大模型加快融入机关工作,提升政务数据处理能力,优化行政决策,推动政务流程智能化,促进跨部门协作与信息共享,笔者认为应进一步解决好DeePSeek等大模型融入机关工作可能面临的数据安全和隐私保护等问题。一、明确目标与定位一方面DeepSeek等大模型确实能提高工作效率,提升决策质量,增强机关的服务能力和水平。另一方面它只是辅助工具,它不能完全替代人的工作。它能为机关的决策和工作提供数据支撑,确保决策和工作客观、准确。它能推动机关工作的创新,提高工作的质量和水平。机关在优化行政决策过程中,可以利用DeepSeek等大模型技术进行数据分析和预测,从而更好地制定政策。
47、例如在公共健康领域监测疫情传播趋势并预测潜在风险,以提前采取应对措施。同时,通过自动化工具减少人为干预,提高决策的客观性和准确性;在推动智能化政务流程中,可以实现政务流程的智能化升级。另外,还可用于优化内部管理流程,如公文处理和资源分配等,提升整体行政效率。它在支持多模态数据处理与分析中,不仅在文本处理方面表现出色,还支持图像、语音等多种数据类型的处理,使其在行政管理中具有广泛的应用潜力,尤其是在促进跨部门协作与信息共享,其开放性和灵活性能够整合不同部门的数据资源,实现跨部门的信息共享和协同工作。但DeePSeek等大模型在融入机关工作时,可能存在数据安全和隐私保护方面的隐患,例如可能涉及跨境
48、传输导致信息泄露的风险。二、数据安全与隐私保护DeePSeek等大模型融入机关工作时,数据安全与隐私保护至关重要。既要建立严格的数据管理制度,又要加强对数据的加密、备份和访问控制,确保数据安全和保密。同时,要严格遵守相关法律法规,保护公民的个人隐私建立严格的数据管理制度。要明确数据的收集、存储、使用和共享规则,确保数据的合法性、安全性和保密性。要加强对数据访问的权限管理。建立严格的数据加密技术。采用先进的加密技术对数据进行加密处理,防止数据在传输和存储过程中被窃取或篡改。同时,定期对数据进行备份,防止数据丢失或损坏。建立严格的数据安全培训。对工作人员进行数据安全和隐私保护的培训,提高他们的安全意识和操作技能,避免因人为疏忽导致的数据泄露。建立严格的应急响应机制。一旦发生数据安全事件,能够及时采取措施进行处理,降低损失和影响。只有在确保数据安全与隐私保护的前提下,DeepSeek才能更好地融入机关工作,发挥其应有的作用。三、与现有系统的融合DeePSeek等大模型融入机关工作,要通过全面评估、合理方案、加强沟通协作以及充分测试验证等措施,实现与现有系统的有机融合。在DeePSeek等大模型融合过程中,要充分考虑系统的兼容性和稳定性,避免出现系统冲突和数据丢失等问题。进行全面的系统评估。深入了解现有系统的功能、架构和运行情况,找出其优势和不足之处,为DeePSeek等大模型融入提