AI读论文新神器:多栏密集文字、中英图文混排文档都能读|旷视

Fox团队投稿量子位|公众号QbitAI虽然多模态大模型都能挑西瓜了,但理解复杂文档方面还是差点意思。面对文字密集、多栏混排等文档时往往力不从心,区域级别的细粒度理解,就更是无从谈起了。最近,旷视团队打造了一支多模态大模型的“点读笔”——Fox,轻松实现对8页文档(

腾讯大模型APP腾讯元宝上线,公司2、3月已申请“腾讯元宝”商标

5月30日,腾讯宣布旗下混元大模型全面升级,基于混元大模型的App“腾讯元宝”正式上线,苹果及安卓应用商店均可下载。相比此前测试阶段的混元小程序版本,腾讯元宝聚焦AI效率工具,提供了AI搜索、AI总结、AI写作等核心能力,能够一次性解析多个微信公众号链接、网址,以及PD

“腾讯元宝”上线安卓应用商店,支持 AI 搜索、总结、写作等能力

IT之家5月30日消息,今日,腾讯正式发布了基于混元大模型的面向消费者端的AI助手“腾讯元宝”,目前已经上架应用宝、小米、华为、vivo、OPPO等应用商店,但IT之家暂未在苹果AppStore中搜到。据官方介绍,腾讯元宝是依托于腾讯混元大模型的AI产品,提供了AI搜索

Firefox 火狐浏览器 126 版更新修复 PDF.js 漏洞

IT之家5月28日消息,Mozilla基金会在 5 月 14 日推出了Firefox 火狐浏览器126版本,官方在更新信息中提到该版本主要修复了浏览器内置的PDF组件(PDF.js)中一项高风险漏洞CVE-2024-4367。据悉,这项“CVE-2024-4367” 代码执行漏洞

因为没人介绍安卓 15 更新,我决定给大家写一份超全汇总

前几天的谷歌开发者大会(GoogleIO),不知道大家都看过了没?没看也没事,发布的东西和ChatGPT4o非常像。我们早前也写了份新消息汇总(点我),大家可以跳转过去看一看。最近这两年,谷歌IO大会的核心议题几乎全都是AI,但再往前数几届,安卓系统的大版本更新才是

安卓版 Acrobat 将支持本地调用 Gemini Nano 汇总 PDF 文档内容

IT之家5月23日消息,开发者米沙尔・拉赫曼(MishaalRahman)昨日发布博文,表示Adobe公司将充分利用GeminiNano模型,计划在安卓新版Acrobat中实现汇总文档内容等AI功能。谷歌推出了名为AICore的全新工具,可以让应用开发者调用GeminiNano本地模型。谷歌基

HuggingFace教你怎样做出SOTA视觉模型

克雷西发自凹非寺量子位|公众号QbitAI前有OpenAI的GPT-4o,后有谷歌的系列王炸,先进的多模态大模型接连炸场。其他从业者在震撼之余,也再次开始思考怎么追赶这些超级模型了。刚好在这时,HuggingFace和法国索邦大学的一篇论文,总结出了构建视觉大模型的关键经验,给开

工信部公布《国家工业和信息化领域节能降碳技术装备推荐目录(2024年版)》

工信部网站5月17日消息,为加快推广应用先进适用节能降碳技术装备,推动重点行业领域节能降碳,现将《国家工业和信息化领域节能降碳技术装备推荐目录(2024年版)》予以公告。以下为原文中华人民共和国工业和信息化部公告2024年第8号为加快推广应用先进适用节能降碳技术装备,

为什么零售数字化解决方案有需求,但并不好卖?

现在,品牌商和零售商面临着传统渠道增长难等问题,而数字化解决方案提供商则面临着目标客户获取难等问题。那么,品牌商/零售商与解决方案服务商之间,是否能够实现双向奔赴?服务商要如何让品牌商放心地与其合作?一、概念说明1.提供数字化解决方案的服务商在营销管理、供应

谷歌宣布Gemini AI融入Android 15系统 手机变得更聪明

【CNMO科技消息】5月15日凌晨,谷歌在I/O大会上宣布,Android15将深度整合其Gemini大模型,为用户带来一系列前沿的AI功能。其中,备受瞩目的即圈即搜功能将不仅限于搜索物体,更增加了截图与题目解答的智能化处理。用户只需圈选题目,Android15便能迅速提供解题思路与答案,