ChatGPTはいろんなことができるが、私が興味があるのは、ChatGPTは私のためにアクションミニゲームを作ってくれるのか、ということだ。
コンピュータに自動的にアクションミニゲームを作ってもらうための試みは、だいぶ前にやった。
ChatGPTの登場によって、今度は大規模言語モデルを使うという新しいアプローチが手軽に試せるようになった。モデルに新しいゲームのアイデアを考えてもらい、そのアイデアを実現するソースコードを実装してもらえばゲームの出来上がりだ。
だが、少なくとも現状のChatGPT(今のところ私はGPT-3.5でしか試していないが)では以下の問題があるように思える。
- ChatGPTに、実装可能なアルゴリズムのレベルまで詳細化された、新しいゲームのアイデアを考えさせるのは難しい
- ChatGPTは、今までにない新しいアルゴリズムを、ソースコードとして実装することを不得意としている
ChatGPTに新しいゲームのアイデアを考えさせるのは難しい
ChatGPTは与えられた問に対して愚直に正しい答えを返すので、単に新しいアクションミニゲームのアイデアを教えて、と聞いても当たり障りのない凡庸なアイデアが返ってくる。
I want you to act as a game designer. Show me ideas for new action mini-games.
Sure, here are a few ideas for action mini-games:
- Time Attack: In this game, the player has to race against the clock to reach the end of a level. The catch is that the clock constantly ticks down and the player must collect time bonuses along the way to keep the clock running. The player must also avoid obstacles and enemies that can slow them down or cost them precious seconds.
...
なので、こういった新しい観点から今までにないゲームを考えて、のようなプロンプトの工夫が必要だ。
ミニゲームのメカニクス群をプロンプトで与えて、それらを組み合わせるように指示したり、
ロジックパズルのように決まったルールの枠組みの中で新しいルールを考えさせたり。
このような工夫で、ある程度はChatGPTにありきたりではないゲームを考えさせることができる。ただ、このようにして返ってきたアイデアはまだぼんやりとしていて、ブレーンストーミングの元ネタにはなるが、ここから具体的なゲームのルール、アルゴリズムまで到達させることは難しい。
より詳細なアルゴリズムにするために、以下のようなプロンプトで、そのゲームの疑似コードを書いてもらうことはできる。
I want you to act as a game programmer. Write a pseudo code outlining the detailed algorithm representing the rules of the following game:
Game 2: Pinball Panic
Selected tags: player: circle, weapon: bounce, field: pins, on pressed: shoot
Description: In this game, the player controls a circular character that bounces around a pinball-like field. The player can shoot projectiles by pressing the button, which bounce off the pins and destroy enemies. The objective is to survive as long as possible while racking up points by destroying enemies and collecting power-ups.
でもこのようにして出てくるコードにはあまり具体性が無く、実装可能な解像度までは遠い。
ChatGPTは新しいアルゴリズムを実装するのは不得意
別の問題として、ChatGPTは既存のアルゴリズムを様々なプログラミング言語で実装するのは得意だが、前例の無い新しいアルゴリズムをコードにするのは不得意なのでは、という点がある。
この記事には、可能であればなるべく火を通らないように目的地までのパスを探索する、というアルゴリズムをChatGPTに書かせようとしたがうまくいかなかった、ということが書いてある。一般的なA*の探索アルゴリズムのコードであればChatGPTは難なく出力するが、それをアレンジした要求をするとうまく答えられなくなるという例だ。
ChatGPTはユーザーの要求を解釈してそれに合致する既存コードを持ってくることや、それに対する追加要求に応じてコードを書き換える、といったことは得意だ。だが、今までに無いアルゴリズムやルールを含むコードを生成する能力がどの程度あるのかは未知数だ。
今までにない簡単なゲームの例として、crisp-game-libで自作したゲームの一つであるPIN CLIMBを、なんとかしてChatGPTに書かせられないかということを試していた。
上記のゲーム実装方法を説明する文章を元に、以下のプロンプトでゲームのアルゴリズムを示す疑似コードを作成し、
I want you to act as a game programmer. Write a pseudo code outlining the detailed algorithm for the following game inside one unique code block. Do not write explanations.
# Characters
- bar
- pins
# Controls
- The bar stretches as long as the button is held down and shrinks to a default length when the button is released.
# Rules
- One end of the bar is fixed to the pin and the other end rotates around the pin.
- The game screen scrolls down so that the bar is positioned slightly above the bottom edge of the screen.
- Pins appear at random locations at the top edge of the screen after each scrolling of a certain distance.
- When the bar catches on another pin, the bar is fixed to that pin.
# Initial state
- Pins are placed in about 10 random positions on the screen, and the bar is fixed to the bottom pin.
その後、以下のプロンプトで具体的なPhaserのソースコードにする、ということを試した。Phaserを選んだのは、JavaScriptベースのゲームライブラリで一番Web上に情報が豊富なのはPhaserだろうという予測の元だ。
Implement the game using the HTML5 game framework "Phaser 3" without using external resources such as image files or audio files. Just show me the JavaScript source code.
結果としてはうまくいかなかった。最初の疑似コード時点で十分な情報量があるか怪しいものが出てくるし、そこからPhaserへの変換もあまりうまくいかない。
疑似コードを挟まず、ピンを書く、スクロールさせる、ひもを回す、のようにステップバイステップで指示して直接ソースコードを書かせても、ひもが他のピンに当たるとそのピンへ固定される、のあたりでうまくいかなくなる。まあここの実装難度が高いのは分かる。回転する矩形の当たり判定を取るのも、当たったあとにそのピンへ固定するのも、両方とも処理としては特殊なので、この辺が限界と言われても納得はできる。
プロンプトの工夫でこれらの課題を乗り越えられる?
分からない。
ゲームのアイデア発想はなるべく自由に、それをルールや実装へ落とすところは具体的に、みたいなことをプロンプトでうまく制御するのはかなり難しいのでは、となんとなく思う。あとモデルの限界はプロンプトでは乗り越えられない。
GPT-ほにゃらら になればこの辺の問題は解決される?
分からない。
画像生成AIの急激な改善を見ていると、半年後にはこの辺の問題は解決するのかもしれない。モデルの規模で乗り越えられる課題なのか、そもそもアプローチとして筋悪なのか、どちらかは現時点では不明だ。
今でもできる他のアプローチがあるのでは?
分からない。
ポンとかブロック崩しとか、既存のゲームのコードをまず提示させて、そこから対話的に新しい要素を加えていく、みたいな方法は今でもうまくいくのかも。その場合、どのくらいの新しさなら許容されるのか、どの程度細切れに指示するのが効率が良いのか、などのプロンプトエンジニアリングが必要そう。
そうやってゲームを作るのが直接コードを書くのに比べて効率良いかと問われると、おそらく悪いので、これは効率性の問題ではなく、ChatGPTを使ってゲームを作るという縛りプレイとしての楽しさを追い求めることになるね。「AIにゲームを作らせるゲーム」という新しいゲームを、旬のうちにいろいろ試したいところだ。