首页  >  行业资讯 >> 信息技术 >> Deepseek大模型凭借其独特的技术优势,在全球占据重要地位

Deepseek大模型凭借其独特的技术优势,在全球占据重要地位

文章来源:www.hers-group.com 作者:和仕咨询整理 阅读量:53 发布时间:2025-03-25


1月20日,DeepSeek正式发布DeepSeek-R1模型并同步开源,迅速在基准测试中崭露头角,1月24日在Arena上已升至全类别大模型第三,风格控制类第一。1月31日,英伟达,微软,亚马逊家美国头部企业接入,2月上线国家超算互联网平台,其影响力持续扩大。

2023年5月16日,北京深度求索人工智能基础技术研究有限公司成立,标志着Deepseek大模型研发征程的开启。2024年1月5日,DeepSeekLLM横空出世,这是其首个大模型,包含670亿参数,在2万亿token的数据集上完成训练,数据集涵盖中英文,并全部开源7B/67BBase和Chat版本,供研究社区使用。随后,DeepSeekCoder、DeepSeekMath、DeepSeek-VL等模型相继发布,不断拓展大模型在代码语言、数学、视觉-语言等领域的能力边界。

根据和仕咨询研究中心发布的Deepseek大模型产业链及重点行业应用机会前景研究报告》显示,Deepseek大模型凭借其独特的技术优势,在全球大模型领域占据重要地位。在性能方面,DeepSeek-V3在知识类任务、数学竞赛等多项基准测试中表现出色,接近甚至超越部分国际领先模型,如在AIME2024、CNMO2024等数学竞赛中大幅超过其他开源闭源模型,展现出强大的知识理解与推理能力。

另外,国内算力产业积极与Deepseek合作,如昇腾社区早在模型发布之初就深度参与,2025年2月4日,DeepSeek系列大模型正式上线昇腾社区,开发者可一键获取并在昇腾硬件平台上开箱即用。目前已有超过30家软硬件企业基于昇腾推出DeepSeek一体机方案,超过80家企业基于昇腾上线DeepSeek。三大电信运营商移动云、电信天翼云、联通云也全面接入DeepSeek开源大模型,基于昇腾生态或自研加速引擎,构建智算底座,实现模型灵活部署。

和仕咨询行业分析人士表示,大模型研发、应用需要大量既懂人工智能技术又熟悉行业业务的复合型人才,目前这类人才相对短缺,限制了大模型技术在各行业的推广和应用。需要加强人才培养体系建设,通过高校教育、职业培训等多种途径,培养适应大模型发展需求的专业人才。

Online consultation

在线咨询

咨询热线

010-67280121