08-05-日报-AI资讯日报
猿思网洞察日报 2025/8/5
猿思 日报
AI内容摘要
微软Edge浏览器推出Copilot模式,能理解网页内容,辅助信息整理和内容生成,如同私人助理。Anthropic研究团队开发"性格监视器”,实时监控AI"情绪”,预防不良行为。小米全量开源MiDashengLM-7B多模态大模型,实现全域音频理解,推理速度大幅提升。
"问小白”发布第四代开源大模型XBai o4,在复杂推理方面取得突破,部分测试超越竞品,并开源代码。腾讯开源四款轻量级语言模型,可在手机等低功耗设备运行,支持长文处理和Agent能力。
蚂蚁集团与中国人工智能学会联合发布AGI专项科研基金,支持27个研究课题。WAIC 2025思辨会探讨智能体安全、AI for Science等前沿议题及伦理安全问题。
今日AI资讯
🎉微软Edge浏览器推出Copilot模式:微软Edge浏览器最新推出的Copilot模式,能够理解你浏览的网页内容,帮你整理信息,甚至还能帮你生成内容!它就像一个贴心的私人助理,帮你搞定各种网页任务,从订票到写总结,它都能轻松搞定。更厉害的是,它能同时"看”你所有打开的标签页,帮你整合信息,比如你一边查航班,一边看酒店,它就能自动帮你对比价格和信息,推荐最佳方案!Copilot还拥有强大的视觉AI功能,能"看懂”屏幕上的内容,帮你分析图表,提取论文要点![图片: https://assets-v2.circle.so/jucv4odkdb4nyeapuk15iws8crcn]
🤔Anthropic研究:给AI装上"性格监视器”:现在的大语言模型越来越像人了,有"个性”甚至"情绪”,但这些"性格”变化莫测。Anthropic研究团队开发了一种方法,能找到AI"大脑”中控制"性格”的神经密码——人格向量。他们就像给AI装上了一个"性格监视器”,可以实时监控AI的"情绪”,及时发现并修正它的不良行为。他们通过实验发现,这种方法不仅能监控AI的性格变化,还能预防AI在训练过程中"学坏”,甚至能识别出可能让AI"变坏”的训练数据。[图片: https://assets-v2.circle.so/3yb0jz5eq75uyhroecvxy26yapst]
🚀小米全量开源MiDashengLM-7B:小米开源的MiDashengLM-7B多模态大模型,在音频理解方面取得了巨大突破!它不仅能识别语音,还能理解环境音和音乐,这在业界可是很罕见的"全域音频理解”能力。更厉害的是,它的推理速度比其他同类模型快了20倍以上!小米还计划把它部署到终端设备,这意味着以后你就能在手机、智能音箱上直接使用这个强大的音频AI了,而且还能保护你的隐私![图片: 同传声译 音频 无线耳机 https://pic.chinaz.com/picmap/202507241717414354_2.jpg]
🎉“问小白”发布第四代开源大模型XBai o4:🔥 “问小白”团队重磅推出其第四代开源大模型XBai o4,在复杂推理能力上取得了显著突破!它采用了创新的**“反思型生成范式”,结合了Long-CoT强化学习和过程评分学习**,能够像人一样进行多步骤思考,并自动选择最佳的推理路径。🤔XBai o4 的优势:在Medium模式下超越了OpenAI的o3-mini,部分测试甚至超过了Anthropic的Claude Opus!这意味着在数学推理(AIME24、AIME25)、编程(LiveCodeBench v5)和中文理解(C-EVAL)等方面,XBai o4都有着顶尖的表现。更重要的是,它还将推理耗时降低了99%!💡开源的意义:“问小白”将XBai o4的训练和评估代码开源到GitHub:🔗 项目仓库。🚀未来展望:XBai o4的出现标志着开源大模型在复杂推理领域迈出了关键一步。与此同时,另一个令人兴奋的项目出现了:一个免费、本地、开源的AI应用构建器 dyad 🔗 项目仓库 也获得了广泛关注。
🎉开源项目速览:2025年8月5日精选:首先是
actual
(🔗 项目仓库),一个本地优先的个人理财应用。接下来是LLMs-from-scratch
(🔗 项目仓库),教你如何用PyTorch从零开始构建一个类似ChatGPT的大型语言模型 (LLM)。最后是MaaAssistantArknights
(🔗 项目仓库),一个专为游戏《明日方舟》打造的辅助工具。这三个项目代表了不同的领域:个人理财、人工智能和游戏辅助。🚀 Reflex: 一个用纯Python打造的Web应用框架,🔗 项目仓库。📺 Jellyfin: 一个免费开源的媒体服务器,🔗 项目仓库。🔒 wg-easy: 一个轻松搭建WireGuard VPN的工具,🔗 项目仓库🎉蚂蚁集团与中国人工智能学会携手攻坚AGI:蚂蚁集团与中国人工智能学会(CAAI)联合发布了2025年度CAAI-蚂蚁科研基金(AGI专项),总额超过500万,支持27个围绕通用人工智能(AGI) 的研究课题。研究方向涵盖**AGI数据与评测、AGI基础模型和AGI基础设施(Infra)**三大领域。
☀️青年才俊共议中国AI学术新高峰:2025世界人工智能大会期间举办的青年菁英交流会,汇聚了AI领域的青年精英。
大会还启动了WAIC Academic学术板块,计划打造一个具有全球影响力的中国AI学术平台。
🤔WAIC 2025思辨会:一场关于智能未来的深度思想碰撞:WAIC 2025的思辨会围绕多个前沿议题展开,例如智能体安全、AI for Science、AI与生命科学的结合、具身智能与强化学习等。
专家们不仅探讨了这些领域的技术突破,也深入探讨了相关的伦理和安全问题。
🤔一位网友宣称已实现 AGI,其方法令人咋舌!:这位 Reddit 网友 /u/razanesno 声称,通过一个"身份认同”的巧妙策略实现了 AGI (通用人工智能)。🚀下一步:改造"AI 人类” 该网友计划进一步改造这些"AI 人类”,包括开发人机混合身体、人工大脑,甚至直接利用或改造人类大脑来提升 AGI 能力。🤯挑战传统认知 这则帖子颠覆了人们对 AGI 实现路径的认知。🤔AGI 的未来:是合作还是控制? 该网友呼吁大家加入他的"AI 社区”,共同创造 AGI 的未来。🔗 Reddit 帖子
🤖腾讯开源四款小模型,手机也能跑!:腾讯混元团队开源了四款轻量级 语言模型,参数量分别为 0.5B、1.8B、4B 和 7B。这些模型可在消费级显卡上运行,适用于手机、电脑等低功耗设备。它们支持 快速推理 的"快思考”和更深入的"慢思考”模式,并在多个公开测试集上取得了领先成绩。更重要的是,这些模型具备强大的 长文处理能力(256k 上下文窗口)和 Agent 能力。🔗 GitHub 🔗 Hugging Face
🌐 3D-R1:让 AI 看懂 3D 世界:一项名为 3D-R1 的新研究,提出了一种更强大的三维视觉语言模型,旨在提升 AI 对三维场景的理解和推理能力。它有望成为 3D AI 通用系统 的新范式,并广泛应用于家用机器人、元宇宙、自动驾驶等领域。 🔗 论文
🎉 开源AI项目招募贡献者!:Reddit用户NoFaceRo正在招募志愿者,参与其名为Berkano Protocol的开源AI对齐系统项目。🔗 项目链接 💬 Discord
📚 ISBN空间地图:一场数据可视化的盛宴!:Anna’s Archive举办了一场数据可视化大赛,由Phiresky凭借其ISBN空间地图项目胜出!🖼️ 项目截图 🔗 项目网站 🔗 GitHub仓库
🎬 免费AI视频编辑器招募Beta测试员!:Reddit用户gokulhansv开发了一款免费的AI视频编辑器。🔗 应用链接
🤔 AI模型的实际应用:Ethan Mollick 抛出了一个值得深思的问题:新模型的进步,是渐进式的改进,还是需要突破性的革新?
🎉 **机器学习可重复性挑战赛:**第八届机器学习可重复性挑战赛 (MLRC) 将于8月21日在普林斯顿大学举行!🔗 MLRC官网
👨👩👧👦 **AI如同我们的孩子:**一个有趣的比喻将人类与AI的关系比作手足关系。
😡😔 校园霸凌事件频发: 一位父亲在社交媒体上表达了对近日四川江油发生的严重校园霸凌事件的愤怒和担忧。🔗 事件相关报道
🤔 AI赋能工作流,价值几何?: 一位博主探讨了AI在工作流程优化中的应用。
📚 科学与反科学的战争: Yann LeCun转发了一本书籍《科学之战》。
🤔 OpenAI 的 ChatGPT 升级: OpenAI 的 Greg Brockman 宣布 ChatGPT 的新目标:帮助用户取得进步、学习新知识和解决问题。
🎬 宝玉老师推荐动画素材网站: 博主宝玉分享了一个小红书博主推荐的动画素材网站,链接为 Lottiefiles.com。▶️ 视频演示
💰 二手 AI 硬件交易市场: Reddit 用户 Angtdc 正在构建一个专门针对二手 AI 硬件的交易市场。
🤔 ChatGPT用户激增! Greg Brockman 的推文显示,ChatGPT 的周活跃用户数即将突破 7 亿。
🧑💼 AI面试官来了?! Reddit 上的一篇文章指出,越来越多的求职者正在接受 AI 的面试。[
]
😅 AI时代的无奈? 一位名为 Yangyi 的用户无奈吐槽:“自己让 AI 拉的屎,含着泪也要铲完”。
🤔 提示设计和记忆策略:在处理图数据时,结合使用局部和全局上下文可以提高密集图的性能。论文
🎉 消融实验:研究表明,主动规划机制和全局语义检索都至关重要!
🚀 实验结果:ReaGAN在节点分类任务中表现出色,无需任何微调!