4 月 11 日,在 2023 阿里云峰会上,阿里版 ChatGPT 通义千问正式亮相。阿里云智能首席技术官周靖人提出,所有的软件都值得接入大模型升级改造,阿里将开放通义千问的能力,帮助每家企业打造专属大模型。
在如火如荼的生成式 AI 浪潮面前,国内已有不少科技企业顺势推出大模型,这些大模型免不了与 ChatGPT 做比较。
谈及这一话题,周靖人接受凤凰网科技等媒体采访时表示,圈内人对于 ChatGPT 的走红并不感到意外,阿里在 19 年就启动了大模型的研发,通义千问并不是为了针对 ChatGPT 而做的,它并不是终态,未来还会有更多的预训练大模型出现。
此前,阿里云已推出“通义”系列模型,包括通义-M6、通义-AliceMind 和通义-视觉模型,而近期发布的超大规模语言模型通义千问,也是该系列的延续。据悉,通义千问具备多轮对话能力、文案创作能力,包括小说续写、邮件编写、企业策划等,同时具备多语言能力和多模态能力。
周靖人坦言,OpenAI 是目前全球大模型领域的引领者,GTP-4 在各个方面都处于一个领先地位,尤其在推理、数学方面都有非常不错的表现,通义千问还不能及。而在文本对话、阅读理解方面,通义千问较为擅长,它每周都在迭代,每周都有进步。
在他看来,AI 技术竞争处于一个你追我赶的态势,这是科技进步的一个必然阶段,大家需要取长补短,阿里希望在下一阶段能够贡献自己的技术创新。
同时,周靖人表示,阿里体系所有产品完成 AI 升级改造未有明确时间表,目前还有许多探索性的工作。可以确定的是,天猫精灵、钉钉会率先接入测试,将在评估认证后发布新功能。
AIGC 竞赛中,算力通常被认为科技企业比拼的重点。周靖人对此表示,不要迷信参数,打造一款人工智能大模型,并不是依靠算力芯片的简单堆叠,这是囊括了底层算力、存储、大数据、AI 框架的系统性工程,需要 A + 云计算的全栈技术能力。阿里是全球少有在几个领域都有深入布局和积累的科技公司之一。
对于科技大厂而言,除了继续追赶大模型训练和进行安全评估外,如何降低成本也是难题,这也是阿里云需要重点攻克的方向。
周靖人表示,如何对专属模型进行进一步成本的降低,能够有效的把真正解决行业问题所需要的那部分智能保留,把其他部分的智能能够节省下来,这中间有非常多的技术的创新和技术的突破,这正是阿里云在这方面比较有优势的地方。
云计算能带来极大的算力资源节约,周靖人指出,当前国内数据中心的 CPU 平均利用率在 10% 左右,而云数据中心内的 CPU 平均利用率,可以达到传统数据中心的 5 到 10 倍。阿里云对主售产品价格的大幅调低,将会促进云计算渗透率进一步提升,更好地满足智能化时代对的算力需求。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。