見出し画像

波に乗り遅れてない?OpenAIが"12日連続で"ChatGPTなどの新機能を続々公開!

年末で何もかもがあわただしく過ぎていく今日のこの頃ですが、12月に入ってChatGPTが「12 Days of OpenAI」と称して続々と新しい機能をリリースさせているのはご存じでしょうか?アドベントカレンダーのように毎日公開されていったChatGPTの新機能について、本記事では軽くご紹介していきます!

12 Days of OpenAI

「12 Days of OpenAI」は12月6日からOpenAIがライブストリーミングで12日間にわたって毎日新機能やサービスの発表を行う企画。ChatGPTといえば日々続々と新機能が追加されているような印象がありますが、まだ12個も連続して発表するようなネタがあるんですね。まずそのことが驚きです。


Day 1:o1 & ChatGPT Pro

まず初日に発表されたのは新しいモデル「o1」の完全版。これまでのGPT-4と比較して数学やコーディング、質問応答で大幅に性能が向上し、テキストと画像を同時に解析するなどマルチモーダルに対応しました。

また、新たなサブスクプランとして「ChatGPT Pro」が登場。新登場の「o1」モデルへの無制限アクセスや高度な音声モードを利用できるほか、「o1 Pro」モードではさらなる計算能力を使って複雑な課題に対応できるとのことです。サブスクの価格は毎月200ドル。なかなか気軽に試せるような値付けではありませんが、どこまでできるのか試してみたい気もします。

Day 2:OpenAI's Reinforcement Fine-Tuning Research Program

2日目は「OpenAI's Reinforcement Fine-Tuning Research Program」。何それって感じですが、訳すと「強化学習ファインチューニングプログラム」。例えば、医療や法律、金融など高度な専門性を要する分野において、既存の教師データではなくそれぞれの分野の学習用データを用意して強化学習を行うことでカスタムAIを作ることができますが、そのための新しい仕組みを提供するということのようです。この新しい仕組みでは、専門性の高い質問においても精度の高い回答が得られるようになるとのこと。まずはこうした分野で研究機関や大学、企業にα版のAPIを提供し、改善を加えて2025年の頭には一般公開していくそうです。

OpenAIウェブページより引用

Day 3:Sora

2日目はやや専門的な内容でしたが、3日目の「Sora」は一般ユーザーも楽しめる内容でした。「Sora」はテキストからビデオを作成する新しいサービス。ChatGPTで画像を作成するように、文章で作りたい内容を指定すれば、短い動画を作成可能です。

soraウェブサイトより引用

誰でも作れるというわけではなく、まずは「ChatGPT Plus」や前述の「ChatGPT Pro」のサブスク登録者が使えるそうです。また、「Plus」は最大50本、720p、5秒間のビデオが、そして「Pro」は最大500本、1080p、20秒間のビデオが作れるなどプランによって作成できるビデオのスペックが異なるとのこと。

Soraにアカウントを作成し、文章で作りたい内容を指定して待てばいいのですぐにできます。実際にいくつか作ってみました。noteと相性の良いGIFでも書き出せるようですよ。

Day 4:Canvas

4日目は文書作成やコーディングを行う際に便利な「Canvas」機能が紹介されました。これまではβ版として公開されていましたが全ユーザーへ順次正式版が公開されていきます。この機能は、文章やコーディングを、ユーザのアクションに応じて即座に提案や修正を提案してくれます。文章作成や学術的なフィードバック、プログラミングのデバッグ作業など幅広いタスクに対応できるそう。

使うには、チャット入力欄の「ツールを表示」ボタンから「キャンバス」をクリック。

文章そのものを全体的に変えるような指示(例えば、「絵文字を随所に入れて」など)を左側の画面で行うことで、右側のアウトプットをChatGPTが編集してくれます。「常体にして」とか「敬語にして」などは日々の作業でも使えそうな気がしますね。

「n件の編集を加えました」の部分をクリックするとChatGPTがどこを編集したのかがわかります。

Day 5:ChatGPT in Apple Intelligence

5日目はAppleの提供するAIサービス「Apple Intelligence」でChatGPTが使えるようになるという発表でした。これまで、iPhoneではSiriがAIサービスとして使えていましたが、このSiriにChatGPTがタスクを引き渡し、これまでのSiriよりも複雑なリクエストに対応できます。また、ChatGPTによって文書作成や要約、編集ができるようになったり、iPhoneに搭載のカメラから得た情報もChatGPTが認識することもできるようになるとのこと。このほか、MacOS上でのApple IntelligenceではあらゆるアプリケーションからChatGPTを起動できるようになるとのことです。

なお、日本ではApple Intelligenceがまだ提供されていません。

Appleウェブサイトより引用

Day 6:Advanced voice with video & Santa mode

ChatGPTと自然な会話ができると各所で驚かれていた「Advanced voice mode」がさらに進化しました。「Advanced voice mode」の中で、iPhoneに搭載されているカメラから得た情報をChatGPTに認識させてその情報に対してチャットすることができます。また、ChatGPTアプリ内でiPhoneの画面共有も可能になりました。例えばメッセージアプリの画面を共有して「気の利いた返信を考えて」と指示したり、Kindleのページを表示させて「このページの内容を要約して」と指示することもできました。例えるなら、ChatGPTという人にiPhoneの画面を見せて、助言をもらうような感じですね。

あと、クリスマスシーズンということで、「Advanced voice mode」で期間限定ですがサンタの音声を選択できるようになりました。日本語も対応しており、いわゆるサンタクロースっぽい男性の声で話せるので試してみてください。

Day 7:Projects in ChatGPT

これまで、会話履歴は左のサイドバーにずらっと並んでいるだけで、まとまりがありませんでした。会話履歴やカスタム指示、関連ファイルをひとまとめにできる「Projects」機能がリリースされました。使い方はフォルダのような感じで、Projectごとにカスタム指示を設定できたり、Project内のファイルを参照しながらチャットをできるとのことです。

Day 8:Search

8日目は検索機能の強化が発表されました。無料プランのユーザーも使えるようになったり、スマホアプリでの検索の速度がより速くなったりしました。会話中に最新情報を取得可能になり、「Advanced voice mode」使用時に音声による指示でリアルタイム検索も可能になりました。よりアシスタントとしての実用性が高まったといえそうです。また、リスト形式といったビジュアルを用いた情報提示が可能になったことで効率的にユーザーは理解できるようになりました。
実際に試してみると、天気やニュースなど、明らかに以前は調べられなかった情報を教えてくれました。

Day 9:Holiday treats for developers

9日目は開発者向けの発表でした。専門的な話なのでさらっと流しますが、ChatGPTを使用した独自のアプリやサービスを開発する際に役立つ機能を強化するものです。「o1」のAPIの正式公開、ユーザーの好みに合わせたファインチューニング機能、リアルタイムAPIの改善、新しいSDKの公開などといったことが発表されたようですね。

Day 10:1-800-CHATGPT

10日は米国内限定ですが、電話とWhatsappアプリからChatGPTにアクセスできるというものです。米国内のユーザーは、1-800-CHAT-GPT(1-800-242-8478)に電話をかけると、ちょっとした会話や料理のレシピなど幅広いリクエストにChatGPTが応えてくれます。電話というある意味レガシーなインターフェイスに対応したことで、いわゆるガラケーからもChatGPTが使えるようになったと考えると、なかなか興味深いですよね。とはいえ、米国内限定サービスなので日本からは使えません。

OpenAIウェブサイトより引用

Day 11:Work with apps

11日目はPC版ChatGPTアプリの改良が発表されました。ブラウザでChatGPTを開くのとは異なり、PC上の他のアプリと直接連携しデータやコンテキストを自動的に取得できるようになりました。コーディングではIDE(統合開発環境)との連携が強化されたり、「o1」が難しいコーディングにも対応します。NotionやApple Notesと連携し、ドキュメント作成や編集をスムーズに行うことができるようになります。また、「Advanced voice mode」をつかうことでPCでも音声での操作がスムーズに行えます。

Day12:o3 preview & call for safety researchers

最後の発表は新モデル「o3」「o3 mini」についてでした。1日目に発表した「o1」の正式版に続き、今度は「o3」のプレビュー版の発表です。まだ一般公開はされておらず、研究者向けの安全性テストを行っている段階とのこと。「o3」は特に数学やコーディングのような複雑なタスクにおいて卓越した性能を持つとのことです。教育や医療、研究開発など幅広い分野で応用できると言います。

OpenAI社からのクリスマスプレゼントともいうべき12個の新機能。そのうちのいくつかは開発者向けだったり米国ユーザーのみのものもあるのが残念ですが、まだまだ進化を続けるChatGPTに今後も期待したいですね。


QUMZINEでは、ほかにも生成AIに関する記事を公開しています。こちらもあわせてお読みください。


QUMZINEを運営するフィラメントの公式ホームページでは、新規事業の事例やノウハウを紹介しています。ぜひご覧ください!


QUMZINEの最新情報は株式会社フィラメント公式X(旧Twitter)でお届けしています!