Afleveringen
-
【内容】
0:00 OP
0:59 ノートブックLMのリリースについて
2:36 Notebook LMの機能紹介
7:24 質問のサジェスト機能が便利
11:00 AppleとOpenAIの提携発表
「耳で学ぶAI、ロボシンク」ではChatGPTなどのAIを初心者向けに分かりやすく解説します。
【リソース】
◎NotebookLM
https://notebooklm.google/
◎Google AI Studio
https://ai.google.dev/aistudio?hl=ja
-----
◎番組の感想や要望はこちら
https://forms.gle/VMyVYWzHSNKZFu787
◎ロボシンク公式サイト
https://bit.ly/3xlLcW0
◎Xアカウント
https://bit.ly/3Tx6maM
◎Youtube
https://bit.ly/4agZS78
-
【内容】
0:00 OP
1:49 モデルナのChatGPT導入
4:45 Superhumanの活用事例
12:20 モルガンスタンレーの活用事例
14:46 東京都の生成AI導入
15:33 東京都職員のAI活用アイデア集
24:46 マイクロソフト社長のAI活用法
26:34 私のAIを活用事例 情報収集の自動化
「耳で学ぶAI、ロボシンク」ではChatGPTなどのAIを初心者向けに分かりやすく解説します。
【リソース】
◎OpenAI公式 企業活用事例
https://openai.com/news/stories/
◎東京都の活用事例
https://www.digitalservice.metro.tokyo.lg.jp/documents/d/digitalservice/ai_prompt
◎Microsoft日本法人 社長の活用事例(PC Watch)
https://nordot.app/1167950159325250458?c=113147194022725109
◎Todoist
https://todoist.com/ja
-----
◎番組の感想や要望はこちら(あなたの活用アイデアなどもお聞かせください)
https://forms.gle/VMyVYWzHSNKZFu787
◎ロボシンク公式サイト
https://bit.ly/3xlLcW0
◎Xアカウント
https://bit.ly/3Tx6maM
◎Youtube
https://bit.ly/4agZS78
-
Zijn er afleveringen die ontbreken?
-
GPTsが無料ユーザーに拡大 / そもそもGPTsってなに? / GPTストアはアプリストアのようなイメージ / 羊の皮を被ったGPTs:GPTsのリスク
「耳で学ぶAI、ロボシンク」ではChatGPTなどのAIを初心者向けに分かりやすく解説します。
【内容】
先日のアップデートで発表されたGPTs無料ユーザーへの解放について話していきます。
そもそもGPTsって?からスタートしてGPTsの細かい内容まで。
・GPTsは利用できるけどGPTsは作れない
・(無料ユーザーは)GPTsでDALL-E 3を使って画像生成できない
・GPTsの利用制限
・(無料ユーザーは)GPTsにレビューを付けることはできない
GPTs利用に関するリスクについても言及します。
【リソース】
◎Canva(デザインツール)
https://chatgpt.com/g/g-alKfVrz9K-canva
◎ElevenLabs(テキストを音声化)
https://chatgpt.com/g/g-h0lbLuFF1-elevenlabs-text-to-speech
◎EasyPaper(論文の要約と翻訳)
https://chatgpt.com/g/g-Ldcixh1NC-easypaper
◎Diagrams(チャートやマインドマップ作成)
https://chatgpt.com/g/g-5QhhdsfDj-diagrams-show-me-charts-presentations-code
◎Fitness workout
https://chatgpt.com/g/g-ipOIcM229-fitness-workout-diet-phd-coach
◎論文(GPT in Sheep's Clothing: The Risk of Customized GPTs)
https://arxiv.org/abs/2401.09075
◎GPTs Q&A -OpenAI公式
https://help.openai.com/en/articles/8554407-gpts-faq
-----
◎番組の感想や要望はこちら
https://forms.gle/VMyVYWzHSNKZFu787
◎ロボシンク公式サイト
https://bit.ly/3xlLcW0
◎Xアカウント
https://bit.ly/3Tx6maM
◎Youtube
https://bit.ly/4agZS78
-
GPT-4oが発表 / GPT-4o何がすごい? / 無料ユーザーに解放された機能 / ChatGPTのデスクトップアプリ / 音声機能の凄さ
「耳で学ぶAI、ロボシンク」ではChatGPTなどのAIを初心者向けに分かりやすく解説します。
【内容】
先日のアップデートで発表されたChatGPTの各種変更点を紹介。新モデルのGPT-4oや無料ユーザー向けに機能が解放されました。
今回のアップデートでは特に「音声」の強化がスゴかったですね。デモで公開された音声機能についても触れます。
【リソース】
◎AIによる朗読のデモ動画
https://www.youtube.com/live/DQacCB9tDaw?si=wehEL1FoX7PJJ13u&t=741
◎AIによる同時通訳のデモ動画
https://www.youtube.com/live/DQacCB9tDaw?si=4JK6xPu9rjdalF1Y&t=1364
◎タクシー停車のデモ動画
https://www.youtube.com/watch?v=KwNUJ69RbwY
◎OpenAI公式ブログ
https://openai.com/index/hello-gpt-4o/
-----
◎番組の感想や要望はこちら
https://forms.gle/VMyVYWzHSNKZFu787
◎ロボシンク公式サイト
https://bit.ly/3xlLcW0
◎Xアカウント
https://bit.ly/3Tx6maM
◎Youtube
https://bit.ly/4agZS78
-
Difyとは? / Difyで出来ること / Difyの使い方 / 商用利用の可否 / 機密情報はどうするの?
「耳で学ぶAI、ロボシンク」ではChatGPTなどのAIを初心者向けに分かりやすく解説します。
【内容】
話題のDifyについて解説します。Difyの概要から、何ができるのかなどを話します。
商用利用や機密情報の取り扱いについても詳しく解説します。
【リソース】
◎Dify公式サイト
https://dify.ai/jp
◎Dify Premium
https://aws.amazon.com/marketplace/pp/prodview-t22mebxzwjhu6
-----
◎番組の感想や要望はこちら
https://forms.gle/VMyVYWzHSNKZFu787
◎ロボシンク公式サイト
https://bit.ly/3xlLcW0
◎Xアカウント
https://bit.ly/3Tx6maM
◎Youtube
https://bit.ly/4agZS78
-
研究論文からプロンプトの原則を学ぶ / プロンプトの大前提はシンプル&明瞭 / Few shot prompt / CoT prompt
「耳で学ぶAI、ロボシンク」ではChatGPTなどのAIを初心者向けに分かりやすく解説します。
【内容】
モハメドビンザイード人工知能大学の研究論文からプロンプトを書くために役立つ原則を解説します。
プロンプトを書く時の手助けになると思います。
【リソース】
◎研究論文(arxiv)
https://arxiv.org/abs/2312.16171
◎PDF資料(Google Drive)
https://bit.ly/3QByCbV
-----
◎番組の感想や要望はこちら
https://forms.gle/VMyVYWzHSNKZFu787
◎ロボシンク公式サイト
https://bit.ly/3xlLcW0
◎Xアカウント
https://bit.ly/3Tx6maM
◎Youtube
https://bit.ly/4agZS78
-
Llama3(ラマ)ってなに? / GPT-4との比較 / イーロンマスクはOpenAIの創業メンバー / Llama3の登場でオープンソース化の波が加速する? / Llama3を使う簡単な方法 / AI搭載デバイス
「耳で学ぶAI、ロボシンク」ではChatGPTなどのAIを初心者向けに分かりやすく解説します。
【内容】
Metaが公開したLlamaについて話しました。
オープンソースの大規模言語モデルがもたらす変化や、AI組込みのデバイスなどについても触れます。
Llama3を使う簡単な方法も紹介します。
【リソース】
◎チャットボットアリーナ
https://chat.lmsys.org/
◎Perplexity(Llama3のお試し環境)
https://labs.perplexity.ai
◎Ray-Ban動画
https://about.fb.com/news/2024/04/new-ray-ban-meta-smart-glasses-styles-and-meta-ai-updates/
-----
◎ロボシンク公式サイト
https://bit.ly/3xlLcW0
◎Xアカウント
https://bit.ly/3Tx6maM
◎Youtube
https://bit.ly/4agZS78
-
ChatGPTでプログラミング独学できる? / ChatGPTの使い所 / 独学には生成AIをこう使う / そもそもプログラミングスキルは必要なのか問題 / おすすめプログラミング学習サービス
「耳で学ぶAI、ロボシンク」ではChatGPTや画像生成AIなど初心者向けに分かりやすく解説します。
【内容】
ChatGPTを使ってプログラミング初心者が独学できるかについて話しました。生成AIを使ったリスキリングの文脈で、学習にどのようにAIを使うのかについて話します。
個人的におすすめしたいプログラミング学習サービスも紹介します。
【リソース】
◎CS50
https://cs50.jp
-----
◎ロボシンク公式サイト
https://bit.ly/3xlLcW0
◎Xアカウント
https://bit.ly/3Tx6maM
◎Youtube
https://bit.ly/4agZS78
-
新サービス、Udioについて解説 / 無料で月に1200曲生成可能 / 商用利用可能(クレジット表記必須) / Suno AIとの比較 / Adobeが生成AI搭載のPremiere Proを発表(Sora, Pika, Runway搭載)
「耳で学ぶAI、ロボシンク」ではChatGPTや画像生成AIなど初心者向けに分かりやすく解説します。
【内容】
新しく発表された音楽生成AIのUdioについて解説。
音楽生成AIではSuno AIが有名ですが、どういった点が違うのか?曲の品質は?という点を掘り下げていきます。同じプロンプトで作成した曲の比較も紹介。
そして、先日発表されたばかりのAdobeが生成AI搭載(Sora, Pika, Runway)のPremiere Proを発表したことについても話します。
【リソース】
◎Udio
https://www.udio.com/
◎Adobe Premiere Pro
https://www.youtube.com/watch?v=6de4akFiNYM&t=7s
◎Alibaba EMO
https://humanaigc.github.io/emote-portrait-alive/
◎Adobe Project Music Gen AI Control(Youtube動画)
https://www.youtube.com/watch?v=J6jhWyU5lBY&t=1s
※このポッドキャスト内の音楽はUdioとSuno AIで作成しました
-----
◎ロボシンク公式サイト
https://bit.ly/3xlLcW0
◎Xアカウント
https://bit.ly/3Tx6maM
◎Youtube
https://bit.ly/4agZS78
-
Perplexity概要 / Perplexityを使うメリット / ChatGPTとの比較 / Perplexity PROの機能 / 変わる検索体験
「耳で学ぶAI、ロボシンク」ではChatGPTや画像生成AIなど初心者向けに分かりやすく解説します。
【内容】
検索特化の生成AIであるPerplexityについて話しました。
ChatGPTやGeminiでも検索や調べ物はできます。しかし、Perplexityを使うことでより良い検索体験を得ることもできます。
実際に国内外でもPerplexityユーザーは増えています。今回のエピソードでは検索特化の生成AIや、生成AIの登場によって変わりつつある検索エンジンについて話します。
【リソース】
◎Perplexity(パープレキシティ)
https://www.perplexity.ai/
※英語の回答が気になる人はプロフィールからPreffered response language(望ましい応答言語)が日本語になっているか確認してください
◎Claude3について話した回
https://spotifyanchor-web.app.link/e/1NbG9rJDCIb
-----
◎ロボシンク公式サイト
https://bit.ly/3xlLcW0
◎Xアカウント
https://bit.ly/3Tx6maM
◎Youtube
https://bit.ly/4agZS78
-
音楽生成AIとは / Suno AI概要 / アップデートで変わったこと / Suno AI + ChatGPTで作曲 / SunoAIで作曲した音楽のデモ
「耳で学ぶAI、ロボシンク」ではChatGPTや画像生成AIなど初心者向けに分かりやすく解説します。
【内容】
音楽生成AIとは?という点から代表格のSuno AIについて解説
Suno AI + ChatGPTを組み合わせた作曲フローや作成した曲のデモを紹介します。
【リソース】
◎Suno AI
https://www.suno.ai/
◎SOUNDRAW
https://soundraw.io/
◎曲 / Jazzy HipHop
プロンプト「jazz, hiphop, piano, male vocal, rap」
https://app.suno.ai/song/a2851f78-2226-4710-9d9c-9419d58b30b6
◎曲 / hello,你好, こんにちは
https://app.suno.ai/song/225b52b1-a2d4-4c73-acdf-a6bfb1b391cd
◎曲 / K-pop
https://app.suno.ai/song/67d99144-42fd-4be8-ae9d-c3aca62d62f9
◎曲 / Suno AI × 与謝野晶子
https://app.suno.ai/song/be4e9f54-15c5-492d-bff2-e0957505c115
-----
◎ロボシンク公式サイト
https://bit.ly/3xlLcW0
◎Xアカウント
https://bit.ly/3Tx6maM
◎Youtube
https://bit.ly/4agZS78
-
生成AIはポッドキャスターに勝てるのか? / ポッドキャスターのAI活用事例について考える / クリエーター vs 生成AI
「耳で学ぶAI、ロボシンク」ではChatGPTや画像生成AIなど初心者向けに分かりやすく解説します。
【内容】
最近、海外のポッドキャスト番組ではAIが制作した番組が増えてきているように感じます。
テキストや動画だけではなくAIの波がポッドキャストにも..と思う中で「AIが作った番組はポッドキャスターに勝てるのか?」ということを考える機会があったので、そのことについて話しました。
【リソース】
◎OpenAI Text to speech
https://platform.openai.com/docs/guides/text-to-speech
◎ElevenLabs
https://elevenlabs.io/
◎CoeFont
https://coefont.cloud/
◎OpenAI Whisper
https://openai.com/research/whisper
◎Runway Gen-2
https://runwayml.com/
-----
◎ロボシンク公式サイト
https://bit.ly/3xlLcW0
◎Xアカウント
https://bit.ly/3Tx6maM
◎Youtube
https://bit.ly/4agZS78
-
CopilotならChatGPTの有料機能が使える / そもそもCopilotってなに? / Copilotで出来ること、出来ないこと / Appleの水面下での動き
「耳で学ぶAI、ロボシンク」ではChatGPTや画像生成AIなど初心者向けに分かりやすく解説します。
【内容】
MicrosoftのCopilotでは最近アップデートがありました。1つはGPT-4 Turboが標準で使えるようになったこと。もう1つはファイルアップロード機能が使えるようになったこと。
CopilotではChatGPT有料版の機能が多く提供されています。現在、ChatGPT無料版を利用していて課金を検討している人は無料でChatGPTの有料機能を試すことができます。
ところでAppleの研究者が生成AIモデルのMM1に関する論文を投稿しました。
Appleが2024年になってAIへの投資を加速させている件についても話します。
【リソース】
◎Microsoft Copilot
https://copilot.microsoft.com/
◎音楽生成AIについて解説した以前のエピソード
https://spotifyanchor-web.app.link/e/5htJCIL71Hb
-----
◎ロボシンク公式サイト
https://bit.ly/3xlLcW0
◎Xアカウント
https://bit.ly/3Tx6maM
◎Youtube
https://bit.ly/4agZS78
-
ChatGPTとClaude3どっちがいい? / Claude3で出来ること、出来ないこと / 開発会社のAnthropicについて / 同じプロンプトでGPT-4とOpusを比較 / Grokがオープンソース化へ / 「耳で学ぶAI、ロボシンク」ではChatGPTや画像生成AIなど初心者向けに分かりやすく解説します。#内容新しく発表された生成AIのClaude3をレビューします。同じプロンプトでChatGPTとClaude3に指示を出し性能に差が出るのかを検証していきます。Claude3の開発元であるAnthropicの成り立ちや現状の会話系生成AIのプレイヤーについても言及します。#リソース◎Claude3公式サイト
https://claude.ai/chats
◎Claude3のベンチマークhttps://www.anthropic.com/news/claude-3-family
-----
◎ロボシンク公式サイト
https://bit.ly/3xlLcW0
◎Xアカウント
https://bit.ly/3Tx6maM
◎Youtube
https://bit.ly/4agZS78
-
Adobeの新サービス、Project Music GenAI Control / 「音」生成AIのプレイヤー達 / SOUNDRAW / SUNO AI / ElevenLabs / CoeFont / 音声AIの問題点
【内容】
Adobeが音楽生成AIの「Projects Music GenAI Control」を発表しました。このサービスの概要について紹介し、その他の「音」に特化した生成AIのプレイヤーを紹介します。
SOUNDRAW, SUNO AI, ElevenLabs, CoeFontなど音楽生成AIと音声生成AIのサービスを紹介します。
そして、音の生成AIが抱える問題点についても言及します。
【番組紹介】
「耳で学ぶAI、ロボシンク」ではChatGPTや画像生成AIなど初心者向けに生成AIを分かりやすく解説します。
【リソース】
◎Adobeの新サービス(Youtube視聴)
https://www.youtube.com/watch?v=J6jhWyU5lBY
◎SOUNDRAW公式サイト
https://soundraw.io/ja/
◎SunoAIで作成された歌
https://twitter.com/Eiichiro_Staff/status/1737790262402064744
◎ElevenLabs公式サイト
https://elevenlabs.io/
◎CoeFont公式サイト
https://coefont.cloud/
◎Open Legal Communityの記事ページ
https://openlegalcommunity.com/ai-generated-voice-of-famous-charactors-how-to-enforce/
-----
◎ロボシンク公式サイト
https://bit.ly/3xlLcW0
◎Xアカウント
https://bit.ly/3Tx6maM
◎Youtube
https://bit.ly/4agZS78
-
ChatGPTとGeminiの比較 / ChatGPT概要 / Gemini概要 / 無料でDALL-E 3を使う方法もある / ChatGPTとGemini今後の展開
「耳で学ぶAI、ロボシンク」ではChatGPTや画像生成AIなど生成AIのトレンドや情報をAI初心者向けにゆるく楽しく解説します。
【リソース】
◎ChatGPT公式サイト
https://chat.openai.com/
◎Gemini公式サイト
https://gemini.google.com/app
◎Microsoft Desiner(無料でDALL-E 3が使えるサイト)
https://www.bing.com/images/create
----
◎ロボシンク公式サイト
https://bit.ly/3xlLcW0
◎Xアカウント
https://bit.ly/3Tx6maM
◎Youtube
https://bit.ly/4agZS78
-
OpenAIが動画生成AIのSoraを発表 / Soraの特徴 / 動画生成AIの主要プレイヤー達(Google, Meta, ByteDance etc..) / 動画生成AIの今後
「耳で学ぶAI、ロボシンク」ではChatGPTや画像生成AIなど生成AIのトレンドや情報をAI初心者向けにゆるく楽しく解説します。
【リソース】
◎Sora公式サイト
https://openai.com/sora
◎WBSのSora紹介動画
https://www.youtube.com/watch?v=s2YlQKJVbWQ
◎ロボシンクPika講座
https://www.robothink.jp/course/pika
-----
◎ロボシンク公式サイト
https://bit.ly/3xlLcW0
◎Xアカウント
https://bit.ly/3Tx6maM
◎Youtube
https://bit.ly/4agZS78
-
Googleの生成AI、Gemini / ジェミニ、ジェミナイどっちで読めばいいのか問題 / GeminiとChatGPTの違い / 同じプロンプトで生成結果を比較 / 2024年の生成AIの展望
「耳で学ぶAI、ロボシンク」は生成AIのトレンドや情報を「耳」で学べるポッドキャストです。
AI初心者向けにChatGPTや画像生成AIの可能性をゆるく楽しく解説します。
【リソース】
◎Gemini公式サイト
https://gemini.google.com/app
◎Duplex(AIレストラン予約)のデモ動画
https://youtu.be/D5VN56jQMWM?si=ncPstt41u4RDik_3
-----
◎ロボシンク公式サイト
https://bit.ly/3xlLcW0
◎Xアカウント
https://bit.ly/3Tx6maM
◎Youtube
https://bit.ly/4agZS78
-
耳だけでChatGPTを理解する試み / ChaGPTの動く仕組み / 得意なこと / 無料・有料プランの違い / 私の活用事例 / 「人間の仕事を奪うのは人間ではない、AIに精通した人間だ」
「耳で学ぶAI、ロボシンク」は生成AIのトレンドや情報を「耳」で学べるポッドキャストです。
AI初心者向けにChatGPTや画像生成AIの可能性をゆるく楽しく解説します。
-----
◎ロボシンク公式サイト
https://bit.ly/3xlLcW0
◎Xアカウント
https://bit.ly/3Tx6maM
◎Youtube
https://bit.ly/4agZS78
【スクリプト】
みなさん、こんにちは。矢野哲平です。このポッドキャストは、無料で学べるAIスキル、ロボシンクがお届けする番組です。耳で学ぶAIをコンセプトに、初心者向けにAIのトレンドやその性質を深堀りしていきます。今回のテーマは「耳だけで理解するチャットGPT」についてです。
はい、というわけで、今日は「耳だけで理解するチャットGPT」というエピソードをお届けします。私は、AIスキルを学べるオンラインスクール、ロボシンクを運営しています。最近、初心者向けにチャットGPTを理解できるようなポッドキャストを配信してほしいというリクエストをいただきました。耳だけで、パソコンを使わずにチャットGPTを学べるかなと思いましたが、面白いと感じ、その意見を採用しました。今日は、チャットGPTをまだ触ったことがない人や、触り始めたけど使い方がよくわからない方向けにお送りします。忙しいビジネスパーソンも、通勤中や移動中に耳で学べると思います。
チャットGPTとは、対話系の生成AIに分類されます。世界には様々な生成AIがありますが、チャットGPTは人間とAIが対話しながらやり取りを進めるサービスです。有名な例としては、受信したメールの返信文を考えるように指示すると、チャットGPTが内容を理解し作成してくれることが挙げられます。また、生成AIに関する文章を作成するように指示すると、その指示に沿った文章を考えてくれます。
チャットGPTの仕組みは、ある種の連想ゲームと言われます。例えば、「昔々あるところに」と言った後、多くの人は続きを連想します。これと同様に、チャットGPTは前の単語に基づき最適な言葉を選び出します。その知識の基盤は、世界中のウェブサイトや論文から学習しています。これにより、人間との会話が可能になっています。
チャットGPTの特徴としては、要約、翻訳、テキスト生成があります。例えば、重要な部分を要約してくれたり、海外の論文を翻訳してくれる使い方が可能です。これにより、情報収集の効率が格段に向上します。また、高度な経済学の理論を説明してくれるなど、人類の持っている知識や情報にアクセスできる点も魅力です。
チャットGPTは誰でも無料で利用できますが、無料プランと有料プランがあります。無料プランでも十分利用できますが、有料プランにはさらに多くの機能があります。例えば、ファイルの操作やGPT-3という新機能が追加されています。GPT-3では、ユーザーがAIに指示する内容に応じて、回答の性能が変わります。これにより、例えばロゴ作成やマインドマップの作成など、特定のプロンプトを使った様々な機能を試すことができます。
私自身も、情報収集やコンテンツ制作、開発など、様々な場面でチャットGPTを活用しています。例えば、海外のニュースレターを自動で翻訳する仕組みを構築したり、記事の構成をチャットGPTに依頼したりしています。また、プログラミングの学習やWebサービスの開発にも役立てています。
AIに関する議論は多岐にわたりますが、私はAIが人間の仕事を奪うのではなく、AIを活用できる人が有利になると考えています。そのため、AIスキルを身につけることがこれからの社会で重要になると思います。ロボシンクやこのポッドキャストを通じて、AIに関する知識やスキルを提供していきたいと思っています。
今日はここまでです。毎週AIに関する情報をお届けしているので、ぜひフォローしてください。ロボシンクの公式サイトでもチャットGPTやその他のAI技術を学べるコースを提供していますので、興味のある方はぜひチェックしてみてください。それでは、また次の配信でお会いしましょう。ありがとうございました。
-
Googleが動画生成AIのLumiere(ルミエール)を公開 / Lumiereの特徴 / Lumiereで出来ること / 現在の動画生成AIのプレイヤー
「耳で学ぶAI、ロボシンク」は生成AIのトレンドや情報を「耳」で学べるポッドキャストです。
AI初心者向けにChatGPTや画像生成AIの可能性をゆるく楽しく解説します。
【リソース】
◎Lumiereプロジェクトページ
https://lumiere-video.github.io/
-----
◎ロボシンク公式サイト
https://bit.ly/3xlLcW0
◎Xアカウント
https://bit.ly/3Tx6maM
◎Youtube
https://bit.ly/4agZS78
【スクリプト】
こんにちは、矢野哲平です。このポッドキャストは無料で学べるAIスキルロボシンクが提供する番組です。耳で学ぶAIをコンセプトに初心者向けにAIのトレンドや可能性を楽しく解説します。今回はGoogleが動画生成AI「Lumiere」を投入したことについて話します。
今日はGoogleがリリースした動画生成AI「Lumiere」について解説します。今収録しているのは1月26日金曜日でちょうど2日前にGoogleの動画生成AIが発表されました。動画生成AIとは指示を出してAIに動画を生成してもらうものです。例えば「砂漠の動画を作って」という指示をするとAIが砂漠の動画を作ります。イメージとしては動画生成ができるチャットGPTのようなものです。
例えばランウェイの「ジェンツー」や「ピカラボのピカ1.0」が有名です。最近リリースされたこれらは動画生成AIで知られています。この領域には今までGoogleは参戦していませんでしたがとうとう動き出しました。
「Lumiere」という言葉はフランス語で光を意味し映画や写真の分野でも使われます。Lumiereの特徴は公式の説明によると既存の動画生成AIが複数枚の画像を生成し繋げる手法を用いていたのに対しLumiereは動画全体の複数枚を一度に生成するため複数枚の繋がりが自然で違和感の少ない動画が可能です。生成できる動画の時間は合計で数分ですがこれは他の動画生成AIと大差ありません。
Lumiereを実際に使ってみたいですが現時点では一般公開されておらず公開時期や費用も未定です。この辺は発表され次第ポッドキャストでお伝えしたいと思います。
今回の情報をまとめるとGoogleが動画生成AIのLumiereを公開しました。Lumiereは既存の動画生成AIと異なるアプローチを取り動画全体の違和感が少なくなっています。Lumiereの公式ページは概要欄に貼っておきますのでぜひご覧ください。
Lumiereでできることにはテキストから動画を生成するテキスト2ビデオ、画像から動画を生成するイメージ2ビデオ、既存の画像のスタイルを参考に動画を生成するスタイライズデンジネレーション、既存の動画を別のスタイルに変更するビデオスタイルデーション、画像の一部が動くシネマグラフ、動画の欠損部分を補うビデオインペインティング、動画の一部を修正する機能などがあります。
現在の動画生成AIのプレイヤーとしてはランウェイの「ジェンツー」やピカ1.0、ステーブルビデオディフュージョンなどがありますが今回のGoogleの参入により2024年の動画生成AI市場はさらに面白くなりそうです。
それでは今日はこの辺で終わります。ありがとうございました
- Laat meer zien