AI Daily-AI资讯日报

猿思网洞察日报 2025/7/19

猿思 日报

AI内容摘要

Meta组建3400人AI团队,目标涵盖AGI基础研究、AI产品及Llama 5研发等。理想汽车获国内首个车载AI安全认证,其车载大模型通过双国标认证。ChatGPT macOS应用推出录音模式,可转录长达120分钟录音并提取关键信息。
户外SLAM技术取得突破,S3PO-GS框架刷新多项记录,解决尺度漂移难题。AI创意引擎Creati年收入破千万美元,成功连接网红和商家,快速生成个性化广告视频。
苹果发布2025基础模型技术报告,OpenAI推出ChatGPT Agent,可主动选择工具完成任务。

今日AI资讯

  1. 🎉Meta 3400人AI超级战队组建完成! Meta公司组建了一个拥有3400多名员工的超级人工智能团队,由前Scale AI的CEO亚历山大·王领导。该团队的目标是"人够少但GPU够多”,下设四个小组:AGI基础研究AI产品(类似ChatGPT的Meta AI助手)基础AI实验室(图灵奖得主Yann LeCun领导)Llama 5研发。Meta还积极从其他公司挖角,但此举也引发了一些内部员工的质疑。AI 机器人 人工智能 (3)数据分析

  2. 🚗理想汽车获国内首个车载AI安全认证! 理想汽车获得国内首批汽车生成式人工智能安全测评证书,其车载大模型通过了GB/T45654和GB45438-2025双国标认证,在AIGC内容安全和标识领域处于领先地位。

  3. 🎙️ChatGPT录音模式上线,会议记录神器来袭! OpenAI的ChatGPT macOS桌面应用推出录音模式(Plus用户),支持长达120分钟的录音,自动生成转录文本、提取关键点,并可生成计划或代码。录音结束后,原始音频会被删除。目前仅支持macOS系统。image

  4. 🏞️🚀户外SLAM技术取得重大突破! 香港科技大学团队在户外SLAM(即时定位与地图构建)领域取得突破,其创新框架S3PO-GS解决了尺度漂移难题,并在Waymo、KITTI和DL3DV三大户外基准测试中刷新了多项记录。该框架的核心在于自洽跟踪模块动态建图机制联合优化架构🔗 项目仓库

  5. 💰✨AI创意引擎Creati年收入破千万美元! Creati是一款专注于广告创意的AI引擎,一年内用户规模突破千万,年收入超过千万美元。它通过AI模型将网红的爆款视频转化为可定制的模板,帮助商家快速生成个性化广告视频。Creati的成功在于深刻理解营销,并成功搭建了连接网红与商家的平台。

  6. 🏢🤔Meta效仿字节?全新AI组织架构曝光! Meta公司组建了一个由3400多人组成的AI团队,由前Scale AI CEO Alexandr Wang 领导。新架构包含四个主要部门:AGI基础研究团队、AI产品团队、基础AI实验室(由Yann LeCun领导)以及Llama 5研发团队。Meta的这一举动反映了对AGI (通用人工智能)和大型语言模型的重视。

  7. 🎬🤖✍️📹🛍️🎶🔄Xiaohu.AI日报摘要 (7.15-7.17): 九大AI工具更新! 本期日报聚焦九大AI工具更新:Vidu的开放式视频生成工具、Moonshot AI的Kimi K2模型、Runway的Act-Two动作捕捉模型、ChatGPT的录音转写功能、LTX Studio的LTX-Video 13B视频生成模型、OpenAI的ChatGPT Agent功能、Suno v4.5+音乐创作工具、MirageLSD实时AI视频风格转换工具。

  8. 💰谷歌Veo3:AI视频生成新贵,价格却让人咋舌! 谷歌的Veo3视频生成模型通过Gemini API开放给开发者,能根据文字提示生成高清视频,但收费标准为每秒0.75美元,成本很高。QQ20250718-085316

  9. 💼🤔Veo3未来展望:技术进步与成本控制的博弈 Veo3的出现代表着AI视频生成技术的一大进步,但高昂的成本限制了其普及。未来,技术进步能否降低成本,将是一个值得关注的问题。🔗 Markitdown 🔗 Open Deep Research

  10. Segment Anything (SAM): 图像分割神器 Facebook Research 推出的 SAM 模型可以轻松地从图像中分割出任何你想要的物体。🔗 项目仓库

  11. 🚀Hyprland: Wayland 桌面环境新星 Hyprland是一个高度可定制、动态平铺且颜值在线的 Wayland 桌面环境。🔗 项目仓库

  12. 🔑Gitleaks: 代码安全卫士 Gitleaks 可以自动查找并标记出隐藏在代码中的密钥、密码等敏感信息。🔗 项目仓库

  13. 🍎🤖苹果发布2025基础模型技术报告及OpenAI通用智能体ChatGPT Agent横空出世! 苹果发布了2025年基础语言模型技术报告,介绍了两种多语言、多模态基础语言模型;OpenAI发布了全新的ChatGPT Agent,它可以主动选择工具,完成任务。图片 🔗 报告链接 图片 🔗 OpenAI介绍

  14. 🌟开源工具DocsGPT DocsGPT旨在帮助用户从知识来源获得可靠的答案,避免幻觉,支持私有信息检索。 🔗 DocsGPT项目

  15. 🤔VisionThink:更高效的视觉语言模型 VisionThink根据任务难度动态调整图像分辨率,比那些使用固定压缩比例的方法要灵活高效得多。🔗 项目仓库

  16. 🤖模仿游戏:让大型语言模型学会像图灵机一样思考 TAIL方法让LLM模仿图灵机的运行过程,提升了LLM在各种任务上的长度泛化能力。

  17. 🛡️自动驾驶安全多模态大型语言模型:给AI系上安全带 AutoSteer在不重新训练模型的情况下,就能提升MLLMs的安全性。

  18. 🚀亚马逊云科技发布Agentic AI全家桶,AI Agent落地加速! 亚马逊云科技发布了全套的Agent AI解决方案,包含四大支柱:模型应用能力、安全性和可靠性、可扩展性以及部署和生产能力,以及全新的Agent开发架构 Amazon Bedrock AgentCore

  19. 👨‍💻开源AI女友Bella火爆全网,3D建模展现惊艳效果! 网友Jackywine开源了他的3D AI女友项目——Bella。🔗 项目仓库

  20. 🔬ACL 2025论文:Evaluation Agent,你的AI模型评测专家! Evaluation Agent是一个能够根据你的需求定制评估方案、并生成专业分析报告的AI模型评测工具。🔗 论文 🔗 代码 🔗 网页

  21. 🤔移民数据安全再受关注: 美国移民与海关执法局(ICE)获得了访问数千万美国人敏感医疗数据的权限,引发了对个人隐私和数据安全的担忧。图片

  22. 🚀黑客马拉松颁奖典礼即将开始: bolt.new 邀请大家一起观看黑客马拉松颁奖典礼直播。▶️ 视频演示

  23. 🤔白宫与PragerU合作开发AI项目? Reddit 上的一则帖子显示白宫与PragerU合作,利用AI技术"美化”建国元勋形象。图片

Last updated on