1月30日,科大讯飞举行星火认知大模型V3.5升级发布会。会上,基于首个全国产算力训练的讯飞星火V3.5、星火语音大模型,以及深度适配国产算力的讯飞星火开源大模型“星火开源-13B”正式发布,�N思开源社区联合也首发上线。
据科大讯飞董事长刘庆峰、研究院院长刘聪介绍,讯飞星火V3.5七大核心能力全面提升,数学、语言理解、语音交互能力超GPT-4 Turbo;星火语音大模型首批37个主流语种效果超过OpenAI Whisper V3,卓越性能使讯飞翻译机可实现更自由沟通;此外,会上还发布了深度适配国产算力的星火开源-13B,其在技术上形成了差异化优势,在多项知名公开评测任务中名列前茅。
值得一提的是,讯飞星火V3.5基于首个全国产算力平台“飞星一号”训练完成。“飞星一号”是科大讯飞与华为在大模型算力底座上的深度共建,华西证券研报指出,这一算力平台的发布,进一步推动了讯飞星火在大模型算力方面的发展,并为行业的科技创新提供了强有力的支持。同时,该算力平台的合作共建,标志着中国科技产业在自主创新、科技国产化方面迈出了坚实的一步,未来国产算力平台有望实现全产业链自主可控。
发布会前一天,科大讯飞发布2023年业绩预喜公告。2023年预计实现归母净利润6.45亿元-7.3亿元,同比增长15%-30%。科大讯飞表示,公司在“讯飞星火认知大模型”上持续投入并保持行业领先、在核心技术和产业配套上持续加大国产自主研发投入,形成在国产算力底座上“飞星一号”领先成果。高强度投入背景下,公司仍保持了经营的良性健康发展。
讯飞星火V3.5七大能力全面提升
发布会上,讯飞星火V3.5、星火语音大模型,以及深度适配国产算力的讯飞星火开源大模型“星火开源-13B”面世。
发布会上最引人关注的,要数进步飞速的讯飞星火V3.5。据刘庆峰介绍,讯飞星火V3.5在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力七个方面进行了全面升级。其中语言理解、数学能力超过GPT-4 Turbo,代码达到GPT-4 Turbo的96%,多模态理解达到GPT-4V的91%。
技术进步如何为人类生活带来真正有效的解决方案?讯飞星火V3.5的能力提升主要体现于人机交互、知识学习与内容创作、提升数智化生产力三个方面。
万物互联时代,人机交互体验尤为重要。讯飞星火V3.5不仅在语义理解、指令跟随和多轮对话的演示中展现出突出能力,更在情绪感知和拟人合成方面表现出色,不仅是得力助手,更是知冷知热的朋友。
知识学习与内容创作则是大模型另一重要应用场景。讯飞星火V3.5针对年终总结计划、述职PPT、活动策划、政策问答等任务游刃有余。基于此,科大讯飞推出了可以一键快速自动生成文档和PPT的办公产品――讯飞智文。
此外,大模型还全新提升数智化生产力,可更好助力科研、工业等民生刚需领域提质增效。随着数学和推理能力的升级,多模态能力逐步进阶,讯飞星火V3.5在视觉问答、联想推理等方面实现了“高分”应对,理解更加精确,表述也更完善。
除讯飞星火V3.5的惊艳效果引来发布会现场观众阵阵惊呼,会上发布星火语音大模型也将气氛推向高潮。大模型为语音技术发展带来全新机会,有望助力科大讯飞在智能语音领域25年间的优势与积累进一步拓展。
刘庆峰表示,借助大模型,一段语音将具备更丰富的属性,“有语种、有内容、有韵律、有音色,还有情绪”。他介绍道,星火语音大模型效果国际领先,中文、英语、法语、俄语等首批37个主流语种的语音识别效果超过OpenAI Whisper V3,而在多语种语音合成方面,星火语音大模型的首批40个语种拟人度超83%。
发布会上,首个基于全国产化算力平台“飞星一号”的开源大模型――星火开源-13B也正式面世,据介绍,该开源大模型深度适配国产算力。目前,华为�N思开源社区已正式上架星火大模型开源版-13B,面对学术、企业研究完全免费,增进学术合作的同时,增进产业探索。
共享源代码是共建第一开发者生态的重要途径。本次开源拥有130亿稠密参数(13B),包含基础模型、精调模型,开源了微调工具、人设定制工具。学术企业研究可以基于全栈自主可控的星火优化套件,更便利地训练自己的专用大模型。
“飞星一号”国产算力平台夯实大模型发展之路
此次对标GPT-4的星火V3.5正式发布,同时科大讯飞逐步构建起的星火开源生态,背后离不开“飞星一号”国产算力底座的支持。
2023年10月24日,科大讯飞与华为携手宣布首个支持万亿参数大模型训练的国产算力平台“飞星一号”投入使用,据介绍,“飞星一号”基于华为�N腾生态,支持万亿参数,合作孵化大模型融合算子,成功将模型训练推理效率提升一倍。
在此背景下,科大讯飞启动对标GPT-4的更大参数规模的星火大模型训练。本次七大核心能力全面提升的讯飞星火V3.5升级发布,是在“飞星一号”启用后的短短90天内收获的重要成果。
大模型发展需要强大的算力支撑。事实上,2023年10月美国商务部工业和安全局发布针对芯片出口禁令新规后,英伟达发布公告对与其相关的限制政策及影响进行说明,美国政府的新规对向中国以及其他D1、D4、D5类国家和地区出口规定了额外的许可证要求,其受限产品包括但不限于A100、A800、H100、H800、L40、L40S及RTX4090等,此举引发市场担忧,这对大模型构建在英伟达算力上的大模型厂商将产生较大影响,人工智能领域市场热度也出现一定退潮。
2023年初,公司与华为�N腾启动专项攻关,与华为联合研发高性能算子库,合力打造我国通用人工智能新底座,让国产大模型架构在自主创新的软硬件基础之上。10月24日科大讯飞与华为联袂推出深度共建的国产算力平台“飞星一号”,更是被业内看作算力可控的重大举措。
业内人士指出,当前大模型大多在英伟达算力底座上进行训练的背景下,“飞星一号”算力平台则走出了一条自主创新的大模型之路。“飞星一号”是科大讯飞与华为在大模型算力底座上的深度共建,为大模型的发展提供第二种选择,产业意义重大。
科大讯飞曾在机构调研时表示,认知大模型在行业深度应用的关键是安全可控、场景驱动、专属可控,其中安全可控的前提就是算力可控,讯飞星火大模型真正踏踏实实地把大模型建立在自主可控的算力基础上,确保可持续发展。也因此,星火大模型未来具备走出国门,面向全球不同国家、不同语种的亿万用户提供AI服务的机会。
“‘飞星一号’算力平台的领先性,以及构建的业界领先的大模型开发者生态,将为产业生态发展提供更多选择,必将推动国产大模型的自主创新。”业内人士谈道。