All in AI的科大讯飞,在近期交出了一份非常亮眼的业绩报,其在人工智能核心技术上的持续投入和创新,实现了营收净利双双稳增。
喜人的势头蔓延到讯飞星火大模型。4月26日,官方正式更新星火大模型V3.5版本,这是首个同时支持长文本、长图文、长语音的大模型。
官方表示,此次升级意在满足更多复杂场景的使用需求,以技术进步,提升用户知识获取和学习的效率,能够真正帮助人们解决日常生活中的刚需问题。
据了解,本次升级主要聚焦在长文本、长图文、长语音、多情感超拟人合成、一句话声音复刻等功能。DoNews小编在iPhone端讯飞星火APP中针对相关升级进行了实测。
打开界面,左上角提供了「对话」、「助手」、「友伴」三个分类。
其中,「对话」的操作流程,就是直接在界面下方的对话框中提出自己的问题和需求,例如“帮我写一份电影《年少日记》观后感”。「助手」则包含职场、创作、编程、生活、出行、脑暴等分类,可以说能够满足绝大多数生活工作学习上的需求。
接下来,我们就一起看下测试内容吧!
一、文本理解力继续up
在长文本能力上,新版能迅速吸收来自各种渠道的大量文本资料,针对各种行业专业领域,它的回答更加准确,同时在文件上传方面、知识问答响应速度以及文本生成方面的效率也显著提升。
对于喜欢历史的小伙伴,星火可以帮助你解答很多历史问题。
例如,在“秦灭六国中,哪个国家被灭得最惨”的问题中,星火不仅可以给出“燕国”这样明确的答案,还能够提出「文化历史被抹去」、「史官与史书遭破坏」、「宗室贵族被屠杀」三个理由,并给到具体的解释说明。
最后的总结整理也具备较强的概括性,甚至有种升华全文的点睛作用。
燕国在秦灭六国中遭遇了非常悲惨的命运,不仅国家被灭,文化和历史也几乎被完全抹去,成为历史上的一个遗憾。
再写一个问题:金庸的《雪山飞狐》中有哪些主要的女性角色?
星火的回答还是比较全面,苗若兰、袁紫衣两大关键人物都有被提及,并附上人物介绍,另外还提到马春花这样的女性角色,对于丰富故事情节、增强作品艺术魅力也起到一定的作用。
如果再延展一下:女生想读金庸的小说,先读哪一本看好?看看会获得什么样的答案:
如果喜欢短篇且结构紧凑的故事,可以从《雪山飞狐》或《连城诀》开始;如果对长篇的武侠世界充满好奇,可以尝试阅读《神雕侠侣》。
除此之外,星火还把《笑傲江湖》和《天龙八部》作为候补,因为这些作品“篇幅较长,情节复杂”,但可以“在对金庸的风格有了一定的了解和兴趣之后,再挑战这些作品。”
语言理解方面,笔者提高难度,尝试让它分析道家《清心诀》中几句话所表达的意思:
心若冰清,天塌不惊。
万变犹定,神怡气静。
尘垢不沾,俗相不染。
虚空宁宓,混然无物。
无有相生,难易相成。
份与物忘,同乎浑涅。
看来,星火的理解力是到位的,可以逐字逐句表述其含义,并给出了整体的理解。
二、专业领域,可以「更专业」
如果是涉及一些行业垂类领域,星火大模型的表现会更专业吗?该部分笔者是在讯飞星火网页端测试,可使用星火合同助手,也可以直接使用长文本问答。
买房对于老百姓来说是件大事,签订购房合同需要慎之又慎,避免掉进坑里。以往可能要自行查询很多资料、询问熟人、甚至找到专业律师来把关,不过现在一个大模型就可以帮忙解决这些事情。
比如,第一次买房没有经验,可以直接问“签购房合同要注意哪些事项?”
从回答上看,星火给出了开发商信息、贷款问题、土地性质、面积误差、交房日期、违约责任、产权证明等十条注意事项,此外还提示“保留好所有的交易凭证和沟通记录,以备不时之需”,算是非常全面了。
再把问题具体化一点,星火的回答会怎样呢?比如“商业贷款利息有点高,想首付多付点选择还款年限15年,怎么样的方式比较合理?”
星火提供了增加首付来源、评估收入状况、了解市场利率变化等建议,对于还款方式,给出了等额本息还款法,因为这种方式“前期还款额较小,适合收入稳定且希望初期财务压力较小的借款人。”
当然,也会提醒你“在做出决定之前,最好咨询金融顾问或银行贷款专员。”可以看出,星火在专业领域上的解答能力已经比较高水平,尤其指向型的提醒也做得非常到位。
除了可以解决日常生活中所遇到与法律、民生相关的问题之外,星火在行业研究、生成报告中也有不错的表现。
科研、教育等专业人士可以快速解读行业文章,提升学习工作效率。比如,想快速了解《收缩型城镇经济韧性研究——以成渝地区为例(章艳秋) 》一文中,是如何解释科学识别人口收缩城镇并评价其经济韧性的,就可以直接输入问题,快速生成回答。
星火还可以快速生成一篇较长的行业报告,比如,笔者针对2023年《人工智能产业报告》中,提出“虚拟偶像和虚拟主播/博主在泛娱乐产业中扮演了什么样的角色,它们如何影响粉丝经济和品牌推广策略?”星火的回答也比较专业。
首先定义虚拟主播是在泛娱乐产业中主要扮演着内容创造者、互动媒介和营销工具的角色,并给出“不仅拓宽了娱乐产业的边界,也为受众带来了全新的互动体验”的评价。
针对粉丝经济和品牌推广策略,也有具体的解析。值得一提的是,这份回答中,星火还可以给出相关建议,比如“应明确品牌理念,并选择与品牌调性相符合的虚拟偶像进行深度合作,以此实现流量导入和销售转化的目的。”非常专业。
此外,对于非传统文本形式的知识获取,针对手机截图、拍摄的学术会议PPT照片或重要谈话、录音等刚需场景,星火可以识别图文、识别音视频,处理复杂的版面分析,覆盖更多专用领域的特殊专业符号。
三、逼真唠嗑,很上头
对话是大模型产品与用户联系最紧密的功能之一,讯飞星火不仅可以聊天,还提供了沉浸式的交互体验,用户可以和其进行对话,体验与类似真实人的对话功能,感受到高兴、抱歉、 安慰、撒娇、困惑等情绪。
甚至,你可以一句话创建自己的专属发音人,选择“创建发音人”-“性别”-根据文字录音,系统会自动进行录音检测-最后生成属于自己的发音人。
笔者尝试和自己的发音人聊天,当我问她“中午想吃什么”,对方回答:
“想吃温暖的蔬菜沙拉,再加一杯新鲜的橙汁,简单又健康”,并且回问“你呢,有什么特别的计划?”
当笔者继续聊天,表示“刚刚做了一份炒排骨,不知道要不要吃主食”时,对方回复道:
“你的排骨一定非常美味......可以搭配简单的主食,比如米饭或者面条......最重要的是根据你的饥饿感决定。”
为了进一步体验有情绪的对话,笔者发出了“什么时候才可以不工作,实现躺赢人生,工作真的好辛苦”的吐槽,星火先是给出了“理解你”的同情感,但也提出实现躺赢需要一定的经济基础,思路清晰。
但请记住,努力工作是为了更好的生活,但也别忘记享受生活中的小确幸~
星火这一波应对得怎么样,算不算得上高情商?笔者承认有被安慰到......
笔者将发音人换成天津的子津(讯飞提供),并且给他讲了一个冷笑话,对方的表现确实出人意料,不仅觉得这笑话像“天津的冬天”,还认为小明的爸爸“挺有创意”,和真人对话几乎无异,令笔者非常惊艳。
如果要求子津讲个冷笑话呢?看得出来,对方欣然接招并且回复也基本没多大问题,甚至还可以“接梗”。
结语:
经过这次对讯飞星火 V3.5 更新版本的体验来看,其综合能力在文本、图文、交流等方面的理解利已达到一定程度的领先水平。要知道,获得这样成绩的讯飞星火,距离首次发布并不足一年,它让我们看到了国产大模型在技术和应用方面无限的发展潜力,也期待未来讯飞星火的持续进化。
友情提示
本站部分转载文章,皆来自互联网,仅供参考及分享,并不用于任何商业用途;版权归原作者所有,如涉及作品内容、版权和其他问题,请与本网联系,我们将在第一时间删除内容!
联系邮箱:1042463605@qq.com