2025年5月22日~5月25日 の生成AI最新ニュース・トレンド

本記事はAIを活用して作成しています。
ChatGPTのDeepResearch機能で最新トレンドをリサーチした結果です。
ぬるったん 2025.05.26
誰でも

【エグゼクティブサマリ】

2025年5月22日から25日の生成AI関連動向を踏まえると、生成AIユーザーが学ぶべき重要なトレンドがいくつか浮かび上がっています。まず、大手企業の戦略として「生成AIの垂直統合化」が進んでいます。GoogleやAnthropicが特定領域に特化したモデルを次々と投入しており、特に医療や教育など専門性の高い分野での活用が加速しています。ユーザーは、用途ごとに最適なモデルを選択する必要性が増し、単一のモデルだけでなく複数のモデルを使いこなすスキルが求められる時代になっています。

また、「AIエージェント」の高度化と「マルチモーダル」の実用化という二大潮流が顕著に進展しています。MicrosoftやAnthropicは複数のAIエージェントが自律的に協調して複雑な作業を遂行する仕組みを整えており、これにより従来人間が行っていた業務をAIが肩代わりする範囲が拡大しつつあります。生成AIユーザーは、AIに仕事を任せるための「指示設計能力(プロンプトエンジニアリング)」や、エージェント同士の連携を管理する能力が新たな必須スキルとなっています。

同時に、手元のデバイスで生成AIを利用する「オンデバイスAI」への流れが加速しています。NVIDIAのAI専用ハードウェアやARMベースのローカルモデルが普及し始め、プライバシー保護や通信遅延回避といった観点からクラウド依存度が低下しつつあります。このため、ユーザーはオンプレミス環境やデバイス内でモデルを運用・最適化するスキルが重要になってきました。

法規制や倫理問題に関しても学びが必要です。欧州や米国では生成AIの規制を巡る動きが活発化しており、企業は対応に追われています。日本国内でも生成AIの著作権や個人情報の取り扱いルールが明確化されつつあり、生成AIユーザーは法的知識やコンプライアンス対応の能力を強化することが求められます。

これらを総合すると、生成AIユーザーは今後、単なるツール利用にとどまらず、「領域特化型のモデル選択」「エージェント活用のための指示設計」「オンデバイス環境での運用スキル」「規制や倫理への理解」といった多面的なスキルセットを身につけることが求められる時代に突入したといえます。

【詳細】

大手テック企業の主な発表・動向

OpenAI

  • AIハードウェアへの進出: OpenAIは5月22日、元Appleのデザイナーであるジョニー・アイブ氏が設立したスタートアップ「io」を約65億ドル相当で買収すると発表しました。アイブ氏はOpenAIのクリエイティブヘッドに就任し、生成AI時代に最適化されたデバイスの開発を主導します。これは人気チャットボット「ChatGPT」の技術と、iPhoneを成功させたプロダクト設計の知見を融合し、「AIネイティブ」な新デバイス(「世界がこれまで見た中で最高にクールなテクノロジー」)の創出を目指す動きです。

  • グローバル展開: (※5月上旬の動き)OpenAIは中東や欧州への進出も進めており、5月にはアブダビに自社インフラ拠点「Stargate」を開設し各国政府と連携する新施策「OpenAI for Countries」を開始、ドイツ法人「OpenAI Deutschland」の設立も発表しました(欧州市場での規制対応・提携強化が狙い)。

Google

  • Google I/O 2025での発表: 5月20~21日の開発者会議Google I/O 2025において、Googleは最新の生成AI戦略を披露しました。中核となる大規模モデルGeminiの強化と共に、医療・教育といった分野特化AIを発表しています。例えばMedGemmaはGemma 3を基にした医療特化のマルチモーダルモデルで、医用画像や臨床データを分析でき、ヘルスケア分野の開発者向けに提供されます。また教育分野では、教育専門家と共同開発したLearnLMモデル群をGemini 2.5に統合し、学習支援において他モデルを凌ぐ性能を示しました。こうした垂直領域への取り組みは、厳しい要件のある医療・教育分野でAI活用を進める狙いです。

  • 生成AI機能の強化: Googleは開発者向けに多数の新機能も公開しました。Gemini APIにはWebページの内容を読み取る「URLコンテキスト」や、外部ツール統合を容易にするMCP(Model Context Protocol)対応が追加され、エージェント開発を支援します。音声面ではGemini 2.5 Flashモデルにより24言語で音声の聞き取り・発話が可能になり、対話AIが声の抑揚や話者スタイルまで制御して自然に会話できるようになりました。さらにオンデバイス向けGemma 3n(2GBメモリでも動作する小型モデル)のプレビュー提供、手話翻訳AI「SignGemma」やイルカ研究データで学習した「DolphinGemma」の開発計画も公表され、特殊ニーズへの対応やAIのアクセシビリティ向上を図っています。

Anthropic

  • Claude 4のリリース: OpenAIの有力競合Anthropic社は5月22日、対話型AIClaudeの新バージョンとなるClaude 4ファミリーを発表しました。これは高性能モデル「Claude Opus 4」と応答高速モデル「Claude Sonnet 4」の2種類で、いずれもコーディング能力や高度な推論力を大幅強化しています。中でもOpus 4はAnthropic史上最強のAIシステムと位置づけられ、長時間にわたる自律的な作業を継続できるよう設計されています。両モデルは指示遵守の精度が向上し、コード生成や複雑な質問への回答においてより自律的に動作可能となりました。例えばテストユーザーである楽天グループは、Opus 4により7時間連続のコードリファクタリングを成功させたとのことです。またAnthropicは新モデル提供に合わせ、安全性強化策**「AI Safety Level 3 (ASL-3)」**の発動(5月22日)やバグ報奨金制度の開始(5月14日)も発表し、リスク低減に努めています。

  • 新機能と提供形態: Claude 4ではツール使用や長時間の思考(Extended thinking)機能が追加されています。例えばClaudeがウェブ検索など外部ツールを並行利用して回答精度を高めたり、開発者がアップロードしたローカルファイルから知識を蓄積することで長期間にわたる対話の文脈を保持することも可能です。またコード特化機能Claude Codeが正式提供され、GitHub Actions経由のバッチ処理やVS Code/JetBrains統合によるペアプログラミング支援が実現しました。これらにより、Claudeはエージェント的な長時間タスク処理や開発支援ツールとして一段と強力になっています。

Microsoft

  • Build 2025でのAI強化: Microsoftは5月19日の開発者会議Build 2025で、企業向けAIソリューションの拡充を発表しました。特にマルチエージェント協調機能が注目され、複数のAIエージェントが人間の監督下でタスクを分担・協調できるようになりました。これは複雑な課題をチームとして解決する企業向けAIのトレンドを象徴するものです。またCopilot Studioにおいては、プログラミング知識なしに自社データや業務フローでモデルを微調整できるCopilotチューニング機能を発表し、企業が独自のAIモデルを低コードで作成・カスタマイズできるようになりました。さらにMicrosoftは前述のMCP標準の策定にも加わり、自社のGitHubやDynamics 365、Azure等に統合を進めています。これは異なるAIエージェントが様々なデータソースやツールに接続しやすくする取り組みで、企業AI導入のハードルを下げるものです。加えて、Microsoft 365向けCopilot機能群(Copilot NotebooksやMicrosoft 365 Copilotアプリなど)の一般提供開始も発表され、オフィス製品への生成AI統合が本格展開されています。

Meta

  • 「Llama」スタートアップ支援: Meta社は自社の大規模言語モデルLlamaファミリー普及策として、新興企業支援プログラム**「Llama Startup Program」**を開始しました。これは採択されたスタートアップに対し、最大月6000ドル相当のクラウド実行枠を6ヶ月提供し、技術サポートも行うものです。狙いはオープンソースで公開しているLlamaモデルのさらなる普及促進で、他社の生成AI基盤への対抗上、開発コミュニティ拡大によるエコシステム強化を図っています。

  • データ規制への対応: 一方でMetaは、ユーザーの公開コンテンツをAI学習に利用する計画について欧州の規制当局と協議を続けてきました。アイルランドのデータ保護委員会(DPC)は5月21日、Metaが提出した更新計画に対する声明を発表しています。MetaはEU圏のFacebook/Instagramユーザーデータを用いたLLM訓練を5月27日から再開する意向で、DPCの勧告に応じて透明性通知の強化や利用拒否フォームの簡素化、十分な事前告知期間の設定など「重大な改善策」を講じたとされています。プライバシー保護団体からの法的圧力も受けつつ、欧州でのAI訓練再開に向けてMetaはデータ保護対策を強化する姿勢を示しました。

その他(NVIDIAなど)

  • NVIDIA: 半導体大手NVIDIAは、開発者や研究者が手元で大規模モデルを扱える個人向けAIスーパーコンピュータ「DGX Station」および高性能ワークステーション「DGX Spark」を発表しました。自社開発のGrace Blackwellチップを搭載し、デスクトップ環境からデータセンター規模まで一貫してモデルの試作・微調整・推論が可能で、最大1ペタフロップの演算性能や128GB共有メモリを備えています。これにより研究開発者がクラウドに頼らず強力な計算資源を利用でき、特に長時間動作するエージェントAIや大規模モデルの実験を加速させる狙いがあります。

  • IBM: IBMは自社AIプラットフォームwatsonx上で企業が迅速にAIエージェントを構築・配備できる環境を強化しており、他社と比べハイブリッドクラウド環境における安全でスケーラブルなエージェント導入をアピールしています。同社はオープンソースの大型言語モデルGraniteシリーズ(13Bモデル等)を発表するなど、企業向けに制御可能かつ信頼性の高い生成AIソリューションの提供に注力しています。

  • その他の協業: 生成AIを巡る企業連携も活発です。AWSはVMware向けのワークロード変革ソリューションにエージェント機能を組み込む新サービスを打ち出し、Cohere社はSAPとの提携により、同社のLLM(いわゆる「推論AI」)をSAP製品のエンタープライズ領域に組み込む計画を明らかにしました。各社がパートナーシップを通じて業界特化型のAI活用を模索する動きが5月下旬も相次いでいます。

生成AI技術の新機能・アップデート

  • 画像生成AI: イラスト・画像生成分野では、Midjourneyが約1年ぶりとなる大型アップデートV7のアルファ版を4月に公開し、5月にはその新機能が話題になりました。V7ではテキストから動画生成するツールや3Dコンテンツ生成機能が導入されており、よりリッチなビジュアル表現が可能になるとされています。競合他社のStable Diffusion系でも進展があり、Stability AIは自社の音楽生成モデルStable Audio Openの軽量版をArm社と協力してスマートフォン上で動作最適化し、従来数分かかっていた音声生成を数秒程度に短縮しました。このStable Audio Open SmallモデルはARMベース端末で完全にローカル動作し、オープンソースで無償利用も可能です。これにより画像・音声といった生成AIがクラウドに頼らず手元のデバイスで実行できる方向性が示されています。

  • テキスト生成AI: 大規模言語モデル(LLM)では先述のClaude 4やGoogle Gemini 2.5の他にも、各種強化が見られます。OpenAIはChatGPT向けにGPT-4.1など次期モデルの準備を進めているとの観測もあり、企業向けChatGPT Enterpriseやプラグイン機能の改良など継続的にアップデートがなされています。日本発の動きとして、NTTデータやスタートアップ各社が自社開発LLM(例:楽天の「Rakuten AI 2.0」シリーズ等)の研鑽を重ねており、5月下旬も金融・製造など業種別にチューニングした日英対応モデルの発表が相次ぎました。テキスト生成モデルはオープンソースでもMPT-30BやFalcon-40Bなどが高精度化しており、コミュニティ主導のモデルも企業の実証に供されています。

  • マルチモーダル: テキスト・画像・音声・動画を組み合わせたマルチモーダルAIも実用段階に近づいています。例えば、Googleは画像と文章を同時に理解して回答できる検索AIモードをテスト中で、5月にはGoogle検索に文章要約や画像説明をする「AIモード検索」が追加され話題となりました。また、OpenAIのChatGPTは既に画像解析や音声会話機能(2023年末公開済)を備えていますが、その応用として先進ユーザーは画像やPDF資料をChatGPTに読み込ませビジネス資料を自動生成するなど高度な使い方を広めています。こうしたマルチモーダル対応の広がりにより、AIとのインタラクションがテキストチャットからあらゆるメディア形式へと拡大しつつあります。

AIエージェントとマルチモーダルAIの進展

近月の生成AI分野では、自律エージェント(AI Agent)とマルチモーダルという二つの潮流が特に注目されています。5月22~25日にかけても各所でこの方向性を強調する発表が見られました。

  • エージェント化の加速: 複数のAIが自律的に協調してタスクを実行する「エージェント指向」の取り組みが各社から打ち出されています。MicrosoftはBuild 2025でエージェント同士がチームを組むマルチエージェントのオーケストレーション機能を発表し、GoogleもGemini APIでエージェント機能(指示に応じウェブを閲覧し情報収集する等)を強化しました。AnthropicのClaude 4は長時間の推論とツール利用を組み合わせ、難解な問題解決やソフトウェア開発タスクを人手を介さず遂行できるよう設計されています。IBMも企業が自社業務に合わせてAIエージェントを構築できる開発環境を提供し、「5分でエージェントを構築」といった迅速導入をアピールしています(ROI試算では3年間で176%の投資回収効果とも)。このように、人間が直接細部を指示しなくてもAI同士や外部ツールと連携して目標達成するエージェント型AIが次世代のキートレンドとなっています。

  • マルチモーダルの高度化: AIが複数のデータ形式を横断的に理解・生成する能力も飛躍的に向上しています。Googleの医療モデルMedGemmaはX線画像と診療記録を同時に解析でき、DeepMindと開発した対話型診断支援AIでは画像診断の所見を対話で説明するデモが披露されました。またGemini 2.5のFlash Audio機能により、AIが人間のように「聞き取り」「発話」まで行えるようになり、24言語で自然な対話を音声で交わせます。Metaも手話をテキスト翻訳するSignGemmaを開発中で、イルカのコミュニケーション解明にAIを応用する試みさえあります。創作領域では前述のMidjourney V7がテキスト動画変換を実装し、Adobeも画像生成AIを動画編集に組み込むなど、各モーダルを統合したクリエイティブが現実味を帯びています。さらにLangChainなど開発ツールも画像・音声データを含むAIワークフローのテストをサポートし始めており、マルチモーダルAIの研究から実装・評価まで一貫したエコシステムが整いつつあります。

日本国内の活用動向

  • 通信・メディア企業の協業: 5月22日、通信大手ソフトバンクと通信社の共同通信が業務提携契約を締結しました。共同通信のニュース記事・写真等のコンテンツを活用し、生成AIモデルの学習用データセットや関連サービスを共同開発する取り組みです。6月から開発を開始し、ソフトバンクのAI知見でコンテンツの価値を守る仕組みを構築することで、生成AIビジネスの健全な発展モデルを示し、ジャーナリズムの維持発展にも寄与することを目指すとしています。報道コンテンツをAIに学習させる際の著作権や信頼性確保の課題に対し、国内で産学連携の解決策を模索する例と言えます。

  • 生成AI活用の広がり(企業): 日本企業における生成AIの実利用も拡大しています。社内コミュニケーションツールSlack上で複数の生成AIモデルを使える無償アプリ「Party on Slack」は、この5月時点で累計200億トークンを消費し1万人以上のユーザーが利用、企業の業務効率化に貢献しています。同アプリでは最新モデルにも迅速に対応しており、OpenAIのGPT-4.1やGoogle Gemini 2.5といった発表直後のモデルも選択可能です。このように国内企業でも複数の生成AIツールを組み合わせて業務に活用する事例が増えており、マーケティングやソフトウェア開発支援など様々な用途で生成AIエージェントが導入されています。

  • 生成AIの国内展開と課題: 一方、海外発の生成AI企業の日本展開には明暗が見られます。画像生成AIStable Diffusion開発元のStability AIは一時日本法人を設立し国内向け公式サイトで導入事例等を発信していましたが、5月22日時点でその日本公式サイトが突如非公開となりアクセス不能になっていることが報じられました。公式X(旧Twitter)アカウントも2024年10月以降更新が止まっており、日本市場での活動に不透明感が漂っています。背景には競合激化や収益性の課題があると見られますが、日本ユーザーからは安定したローカルサポートへの期待も大きいため、今後の動向が注視されています。

  • 行政・教育現場での活用: 日本の行政機関や教育現場でも生成AI活用が進みました。神奈川県横須賀市は2023年4月に全国初となる庁内ChatGPT活用を開始し、「生成AI開国の地」として注目されています。総務省の調査によれば2024年7月時点で都道府県の51.1%、政令市の40.0%、その他市区町村の9.4%が何らかの形で生成AIを導入済みで、この数は2025年に入ってさらに増加傾向です。5月時点でも半田市(愛知県)が自治体向けChatGPTサービスの実証を終え本格導入を決定するなど、自治体の業務効率化や住民サービス向上に生成AIを活かす事例が各地で広がっています。また教育分野では、生成AIを授業や学習支援に取り入れる動きが活発化し、高校の英語課題でChatGPTを作文に活用する実験や、大学でのレポート指導にAIを組み込む試みも見られます。しかし、米国では教授が学生にAI使用を禁じつつ自身は教材作成にChatGPTを用いていたことが発覚し批判されるなど、教育現場でのAI利用ルール策定は世界的な課題となっています。

利用規制・倫理・法制度を巡る議論

  • 米国:規制禁止条項を含む法案可決: アメリカでは、連邦レベルで生成AIの規制を巡る攻防が続いています。ドナルド・トランプ大統領(2025年就任)が推進する大型予算法案「One Big Beautiful Bill」に、州や自治体によるAI規制を10年間禁止する条項が盛り込まれ、5月22日に下院を僅差で通過しました。この条項は「AIモデルや自動意思決定システムを州が規制することを禁ずる」内容で、カリフォルニア州など複数の州で検討されていた独自のAI規制法案に歯止めをかける狙いがあります。可決後、ホワイトハウスは「米国第一主義のAI政策を法律として確立する世代に一度の機会」と声明を出し歓迎しました。一方AI業界では、OpenAIのサム・アルトマンCEOがかつて「AIの害を抑えるには政府の規制介入が必要」と述べていた経緯もあり、規制賛否を巡る議論が巻き起こっています。

  • 欧州:包括的AI規制と企業対応: 欧州連合(EU)では2024年に世界初の包括的AI規制法(AI Act)が成立し、2025年から段階施行が始まりました。5月には上述のMeta社のデータ利用計画に対しアイルランドDPCが欧州のGDPRに照らした対応を発表し、一定の条件下でAI訓練を容認する動きとなりました。一方でプライバシー団体noybは5月14日付でMetaに対しユーザーデータ利用停止を求める書簡を送付しており、大手プラットフォーマーによる個人データ活用を巡る法的争いが続いています。また欧州ではクリエイターの著作物を無断学習することへの訴訟も増えており、5月下旬もGetty Images社によるStable Diffusion開発元への著作権侵害訴訟進展が報じられました(イギリスでの訴えが棄却され米国で係争中)。このように欧州はAIの透明性・説明責任や著作権保護の面で世界をリードする規制強化を進めており、各企業は対応に追われています。

  • 日本:ガイドライン策定と著作権議論: 日本国内では政府が生成AIの社会実装とリスク対策を検討しており、経産省は5月、「生成AI活用促進プロジェクト(GENIAC-PRIZE)」を開始して企業や研究機関からの提案募集を始めました。総務省も自治体でのAI利用ルールやデータガバナンス指針作りを進めています。また著作権の観点では、生成AIが学習に既存作品を用いる問題について文化庁がガイドライン策定を進め、クリエイターへの適切な利益還元や二次創作との線引きが議論されています。5月下旬、JASRACは音楽著作物を生成AI学習に提供する場合の契約モデル案を公表し始めており、業界横断的なルール形成が進みつつあります。倫理面では、研究者コミュニティでAIのフェアネス(公平性)や説明可能性を検証する取り組みが増えており、日本ディープラーニング協会(JDLA)は6月に生成AIエンジニア検定を初開催して人材育成とリテラシー向上を図る予定です。

ユーザーコミュニティの注目トピック・トレンド

  • 生成AIサービスの人気動向: エンドユーザーの関心では、対話AIのChatGPTが依然突出した人気を保っています。日本のIT情報サイトの調査によれば、2025年5月時点のWebアプリ型生成AIサービス人気ランキングでChatGPTが第1位となり、その多用途性と高精度な応答から「生成AIの代名詞」と評されています。一方、第2位には中国発の新興サービスDeepSeekがランクインしました。DeepSeekは2025年1月に公開されたLLMで、公開直後20日間で1000万人以上のユーザーを獲得する急成長を見せており、そのスピードはChatGPTをも上回ると話題になりました。この他、AIキャラクターと自由に対話できるCharacter.aiや検索エンジン強化型のPerplexity AI、そしてAnthropicのClaudeなど、多彩な生成AIツールがユーザーコミュニティで注目を集めています。用途に応じて複数のサービスを使い分けるユーザーも増え、例えば創作対話はCharacter.ai、調べ物はPerplexity、プログラミングはGitHub Copilotといった形で**「AIスタック」**を構築するトレンドも見られます。

  • オープンソース&オンデバイス志向: 技術系コミュニティでは、オープンソースの生成AIやオンデバイスAIへの支持が高まりを見せています。MetaのLlama 2が無償公開されたのを皮切りに、Stability AIのStable DiffusionやStable Audio、各種オープンLLMが相次いで登場し、5月も前述のようにARM最適化モデルや小型モデルの発表が続きました。これらは手元のPCやスマホで動くAIとしてプライバシー保護や低遅延のメリットがあり、専門家だけでなく一般ユーザーにも歓迎されています。例えばプログラマー向けにはスタンドアロンで動作するコード生成AI(Code LLM)が人気となり、文書要約AIをブラウザ拡張機能として組み込む動きも広がっています。コミュニティ有志がモデルの軽量化や日本語データでの再学習を行うケースも多く、GitHub上では日本語特化のチャットモデルや音声対話モデルが多数公開されています。こうした草の根の創意工夫が、大手企業のモデル開発に対する民主化圧力ともなっており、5月下旬時点でも「誰もが使えるAI」を目指すオープンソースプロジェクトが活発に議論・開発されています。

  • 「AIエージェント」ブーム: 4月頃から始まった自律型AIエージェントのブームもコミュニティで継続しています。例えばAuto-GPTやGPT-Engineerといったオープンソースプロジェクトは、ユーザーが目標を与えるとAIが自律的にタスクを分割実行するもので、国内外の開発者が検証・改善に取り組んでいます。5月22日には米LangChain社主催のイベント「LangChain Interrupt」が開催され、エージェントの高度化や評価手法について盛んに議論されました。日本でも有志による勉強会やハッカソンが行われ、ブラウザ自動操作や業務フロー自動化を行うエージェントの試作が共有されています。これらの活動は**「AIに仕事を任せる」**という次世代の労働観にもつながっており、SNS上では「AIエージェントが1日で○○をやってみた」といった投稿が注目を集めました。

以上、2025年5月22日から25日にかけて報じられた生成AI分野の主なニュース・話題をカテゴリ別にまとめました。わずか数日間にも関わらず、技術面・産業面・社会面で多岐にわたる進展が見られ、生成AIの進化スピードの速さを改めて感じさせる内容となっています。各社の競争と協調が続く中、ユーザーコミュニティ発の創意も相まって、生成AIは新たな段階へと移行しつつあるようです。

無料で「DataScience&GenAI Trend Letter」をメールでお届けします。コンテンツを見逃さず、読者限定記事も受け取れます。

すでに登録済みの方は こちら

サポートメンバー限定
2025年6月2日~6月4日 の生成AI最新ニュース・トレンド
サポートメンバー限定
2025年5月29日~6月1日 の生成AI最新ニュース・トレンド
サポートメンバー限定
2025年5月26日~5月28日 の生成AI最新ニュース・トレンド
サポートメンバー限定
2025年5月19日~5月21日 の生成AI最新ニュース・トレンド
サポートメンバー限定
2025年5月15日~5月18日 の生成AI最新ニュース・トレンド
サポートメンバー限定
2025年5月12日~5月14日 の生成AI最新ニュース・トレンド
誰でも
2025年5月8日~5月11日 の生成AI最新ニュース・トレンド
サポートメンバー限定
2025年5月5日~5月7日 の生成AI最新ニュース・トレンド