07-19-Daily AI Daily
猿思 ウェブインサイト日報 2025/7/19
猿思 日報
AIコンテンツサマリー
Metaが3400人のAIチームを結成し、AGIの基礎研究、AI製品、Llama 5開発などを目標にしています。理想汽車が国内初の車載AI安全認証を取得。車載大規模モデルが二つの国家標準認証をクリアしました。ChatGPT macOSアプリが録音モードを導入。最長120分の録音を文字起こしし、重要情報を抽出可能です。
屋外SLAM技術がブレイクスルー。S3PO-GSフレームワークがスケールドリフト問題を解決し、複数の記録を更新しました。AIクリエイティブエンジンCreatiが年間売上高1000万ドルを突破。インフルエンサーと企業を繋ぎ、パーソナライズされた広告動画を迅速に生成しています。
Appleが2025年基盤モデル技術レポートを発表。OpenAIはChatGPT Agentをリリースし、ツールを自律的に選択してタスクを完了できるようになりました。
今日のAIニュース
Metaの3400人AIスーパーチーム、ついに結成されたぜ! なんと、Metaが3400人以上もの巨大なAIチームを立ち上げたんだ。元Scale AIのCEO、アレクサンドル・ワンがそのリーダーを務めている。彼らの目標は「人は少ないけどGPUはたっぷり」なんだって!チームはAGI基礎研究、AI製品(ChatGPTみたいなMeta AIアシスタントね)、基礎AIラボ(チューリング賞受賞者のヤン・ルカンが率いるよ)、そしてLlama 5開発の4つのグループに分かれている。Metaは他社からも積極的に優秀な人材を引き抜いているけど、これには社内の一部から疑問の声も上がってるみたいだね。
理想汽車が国内初の車載AI安全認証をゲットしたぞ! 理想汽車が、国内初の自動車生成式AI安全評価証明書を取得したんだ。彼らの車載大規模モデルがGB/T45654とGB45438-2025という二つの国家標準認証をクリアしたって話だから、AIGCコンテンツの安全性や識別の分野でかなりリードしてるってわけだね。
ChatGPTの録音モードが登場!会議の議事録作成ツールとして最強かも! OpenAIのChatGPT macOSデスクトップアプリに、なんと録音モードが追加されたんだ(Plusユーザー向けね)。これ、最長120分までの録音に対応していて、自動で文字起こししてくれて、キーポイントを抽出したり、計画やコードまで生成してくれるんだよ。録音終了後には元の音声は消去されるから安心だね。今のところmacOSシステムだけしか使えないけどね。
屋外SLAM技術にスゲー進歩があったぞ! 香港科技大学のチームが、屋外SLAM(自己位置推定と環境地図作成)分野で大きなブレイクスルーを達成したんだ。彼らが開発した革新的なフレームワーク「S3PO-GS」が、スケールドリフト問題を見事に解決しちゃったんだよね。しかも、Waymo、KITTI、DL3DVっていう主要な屋外ベンチマークテストで、複数の記録を塗り替えたんだからすごい!このフレームワークの肝となるのは、自己整合型追跡モジュール、動的マッピングメカニズム、そして統合最適化アーキテクチャなんだってさ。🔗 プロジェクトリポジトリ
AIクリエイティブエンジン「Creati」、年間売上1000万ドルを突破したってよ! Creatiっていう広告クリエイティブに特化したAIエンジンが、たった一年でユーザーが1000万人を突破し、年間売上高も1000万ドルを超えたんだって!このエンジンは、AIモデルを使ってインフルエンサーの人気動画をカスタマイズ可能なテンプレートに変換して、企業がパーソナライズされた広告動画をサクッと作れるように手助けしてるんだ。Creatiの成功の秘訣は、マーケティングを深く理解している点と、インフルエンサーと企業を繋ぐプラットフォームをうまく構築した点にあるね。
Meta、ByteDanceを真似たのかな?新しいAI組織体制が明らかになったぞ! Metaが、元Scale AIのCEO、Alexandr Wang率いる3400人超のAIチームを立ち上げたんだ。この新しい組織体制には、大きく分けて4つの部門が含まれてるんだよ。AGI基礎研究チーム、AI製品チーム、基礎AIラボ(これはヤン・ルカンが率いるんだって)、そしてLlama 5開発チームだね。Metaのこの動きから、AGI(汎用人工知能)と大規模言語モデルにかなり力を入れていることがわかるね。なるほど〜。
Xiaohu.AI日報サマリー (7.15-7.17): 9つのAIツールがアプデしたぞ! 今号のレポートでは、9つのAIツールのアップデートに焦点を当てているんだ。具体的には、Viduのオープンな動画生成ツール、Moonshot AIのKimi K2モデル、RunwayのAct-Twoモーションキャプチャモデル、ChatGPTの録音書き起こし機能、LTX StudioのLTX-Video 13B動画生成モデル、OpenAIのChatGPT Agent機能、Suno v4.5+音楽制作ツール、MirageLSDリアルタイムAI動画スタイル変換ツールだね。
GoogleのVeo3:AI動画生成のニューカマー、でも、その値段にはビックリ仰天するぜ! GoogleのVeo3動画生成モデルが、Gemini APIを通じて開発者向けに公開されたんだ。テキストプロンプトに基づいて高画質動画を生成できるんだけど、その料金はなんと1秒あたり0.75ドルもするから、コストがかなりかかっちゃうんだよね。
Veo3今後の展望:技術進化とコスト抑制のせめぎ合い Veo3の登場は、AI動画生成技術にとって大きな一歩だね。でも、高すぎるコストが普及の妨げになっているんだ。将来的には、技術の進歩でコストがどこまで下がるのか、それが注目すべきポイントになるだろうね。🔗 Markitdown 🔗 Open Deep Research
Segment Anything (SAM): 画像セグメンテーションの神ツール Facebook ResearchがリリースしたSAMモデルは、画像から好きなオブジェクトを簡単に切り出せるんだ。まさに神ツールだね!🔗 プロジェクトリポジトリ
Hyprland: Waylandデスクトップ環境のニュースター Hyprlandは、高度にカスタマイズ可能で、動的なタイル型、しかも見た目もイケてるWaylandデスクトップ環境なんだ。🔗 プロジェクトリポジトリ
Gitleaks: コードのセキュリティガード Gitleaksは、コードに隠された秘密鍵やパスワードなんかの機密情報を自動で見つけてマークしてくれるんだ。これは便利だね!🔗 プロジェクトリポジトリ
Appleが2025年基盤モデル技術レポートを発表、そしてOpenAIの汎用エージェント「ChatGPT Agent」がいきなり登場したぞ! Appleは、2025年基礎言語モデル技術レポートを公開し、二種類の多言語・マルチモーダルな基礎言語モデルについて紹介したんだ。一方、OpenAIは全く新しいChatGPT Agentを発表。これはツールを自律的に選択して、タスクを完了できるスゴいやつなんだ!画像 🔗 レポートリンク 画像 🔗 OpenAIの紹介
オープンソースツール「DocsGPT」 DocsGPTは、ユーザーが知識ソースから信頼性の高い答えを得て、幻覚(ハルシネーション)を避けることを目指しているツールだよ。プライベートな情報検索にも対応してるんだ。🔗 DocsGPTプロジェクト
VisionThink:より効率的な視覚言語モデル VisionThinkは、タスクの難易度に応じて画像の解像度を動的に調整するから、固定圧縮比を使う方法よりも、はるかに柔軟で効率的なんだ。これはすごいね!🔗 プロジェクトリポジトリ
模倣ゲーム:大規模言語モデルにチューリングマシンみたいに考えさせる TAIL手法は、LLMにチューリングマシンの動作プロセスを模倣させることで、LLMの様々なタスクにおける長さの汎化能力を向上させたんだ。
自動運転の安全なマルチモーダル大規模言語モデル:AIにシートベルトを装着するようなものだね! AutoSteerは、モデルを再トレーニングすることなく、MLLM(マルチモーダル大規模言語モデル)の安全性を向上させられるんだ。これは素晴らしいね!
Amazon Web ServicesがAgentic AIのフルセットを発表、AIエージェントの実装が加速するぞ! Amazon Web Servicesが、エージェントAIソリューションのフルセットをリリースしたんだ。これには、モデル適用能力、安全性と信頼性、スケーラビリティ、そしてデプロイと本番運用能力という4つの主要な柱が含まれていて、さらに新しいエージェント開発アーキテクチャAmazon Bedrock AgentCoreも発表されたんだよ。
オープンソースのAI彼女「Bella」、ネット中で大バズり!3Dモデリングが驚きのクオリティを見せつけたぞ! ネットユーザーのJackywineが、彼が手がけた3D AI彼女プロジェクト「Bella」をオープンソース化したんだ。これはチェックしないと!🔗 プロジェクトリポジトリ
ACL 2025論文:Evaluation Agent、あなたのAIモデル評価のプロフェッショナル! Evaluation Agentは、あなたのニーズに合わせて評価プランをカスタマイズし、専門的な分析レポートまで生成してくれるAIモデル評価ツールなんだ。これは頼りになるね!🔗 論文 🔗 コード 🔗 ウェブページ
移民データセキュリティ、再び注目を浴びる: アメリカ移民関税執行局(ICE)が、数千万人のアメリカ人の機微な医療データへのアクセス権を得たことで、個人のプライバシーとデータセキュリティに関する懸念を巻き起こしているんだ。これは考えさせられるね。
ハッカソン授賞式、もうすぐ始まるぞ! bolt.newが、みんなにハッカソン授賞式のライブ配信を一緒に見ようって誘ってるぜ。見逃せないね!▶️ ビデオデモ
ホワイトハウスがPragerUとAIプロジェクトで提携してるって? Redditの投稿によると、ホワイトハウスがPragerUと協力して、AI技術を使って建国の父たちのイメージを「美化」してるって話だ。マジかよ?画像