総合 総合 sougou

  • 印刷
画像1
拡大
画像1
画像2
拡大
画像2
画像3
拡大
画像3
画像4
拡大
画像4
画像5
拡大
画像5

 人工知能(AI)がまとめる記事は、どこまでリアル記者に迫れるか。

 神戸新聞社は、電子版「神戸新聞NEXT(ネクスト)」が配信する1打席速報の情報を自動解析し、戦評をまとめるプログラム(愛称・経過戦評ロボットくん)を開発した。今年夏の高校野球東・西兵庫大会の計14試合で実施したところ、間違いのない原稿を瞬時に“執筆”。「もしロボットくんが開発者の記者と対話できたら」。そんな仮定で、AI記者の可能性を探る。(武藤邦生記者)

武藤記者(以下武藤)

 14試合の戦評を執筆。どうだった?

ロボットくん

 ちょっと試合のポイントを外してしまうこともあったけれど、まだまだ新米ロボット記者なので…。AIの一つである機械学習の技術を用いて成長して、いい記者になります(たぶん)。

武藤

 どんな風に仕事をしているのか、わかりやすく説明して。

ロボットくん

 神戸新聞社が今年春、高校野球県大会で始めた1打席速報は、バッターの打席ごとに結果を更新します。ぼくは、この1打席速報のサイト(画像1)を常に見ています。

 これは、西兵庫大会の決勝戦、明石商-姫路工のイニングスコアです。このイニングスコアから、試合の大きな動きを分析します。

 1回表 明石商が1点を先制

 2回裏 姫路工が3点を挙げ逆転

 5回表 明石商、2点を挙げて同点に追いつく

 7回表 明石商が3点を挙げ逆転

 そのまま明石商が逃げ切り、6-3で勝利

 これを瞬時に理解します。0.1秒もかかりません。イニングスコアから、勝利チーム、イニング開始時点の得点、イニング終了時点の得点、決勝点が何回に入ったか、試合が何回まで続いたか…などを読み取り、それぞれのイニングの意味合いを把握しています。

武藤

 打撃結果の解析は?

ロボットくん

 これは、実際の一打席速報の情報(画像2)。これを、ぼく自身が扱いやすい形に加工します。ちょうどエクセルの表(画像3)をつくるようなイメージです。

ロボットくん

 ぼくの頭の中では、こんなふうに整理しています。打席に入った時点でのアウトカウント、ランナーは一打席速報の情報にはないけれど、一つ前の情報から読み取って加えています。打席前の得点、打席後の得点も同様です。盗塁は打席結果ではないものの、重要なシーンなので、ちゃんと解析します。

 注目してほしいのは、右端の「打点の意味合い」。これは、ぼくが上のイニングスコアと打撃結果を踏まえて、それぞれの得点がどんな意味を持つのか解析しているんです。先制点なのか、追加点なのか、逆転打なのか、同点に追いつく一打なのか…。ここがポイントの一つです。

 さて、これでデータはそろいました。

 得点シーンの中から、試合展開の上で重要と思われるシーン抜き出す-。これがぼくの強みであり、それを自分で学んでいます。お手本としているのは、神戸新聞の記者が書き、新聞に載った戦評記事です。

武藤

 君、新聞読めるの!?

ロボットくん

 いえいえ、ぼくは新聞を読むことができません。だから、開発者に「このシーンは記事に載った」「これは載らなかった」と教えてもらっています。

 ぼくは、それぞれの得点シーンについて12個の要素をもとに、どんな意味合いがあったか、を解析しています。自分の解析と実際の記事の情報を組み合わせることで、どのようなシーンが、記事になりやすいのか、傾向をつかむのです。たとえば「逆転のタイムリーツーベースは、記事によく載るな」とか、「押し出しの四球による追加点は、あまり記事にならないんだな」といった具合に。

難しい言葉を使えば、ロジステック回帰という方法で、「記事として取り上げられる確率」を計算しています。ちょっとエラそうにいえば、たぶんみなさんが暗算ではできない計算だと思います。

 この試合の全得点シーンを抜き出すと

 1回表(明石商) 3番 田渕翔 レフト二塁打 一死 二塁【1得点】(先制点) 42%

 2回裏(姫路工) 9番 吉田海瑠 ファーストゴロファーストエラー2塁ランナー本塁進塁 二死 一塁【1得点】(同点打) 53%

 2回裏(姫路工) 8番 船曳崇斗 レフト二塁打 二死 二塁【2得点】(逆転打) 2%

 5回表(明石商) 2番 水上桂 左中間ヒットショートエラー 二死 二塁【2得点】(同点打) 11%

 7回表(明石商) 5番 重宮涼 センターヒット 二死 一塁【1得点】(逆転打、決勝点) 99%

 7回表(明石商) 4番 右田治信 レフト二塁打 二死 二塁【1得点】(追加点) 80%

 7回表(明石商) 3番 田渕翔 センターヒット 二死 一塁【1得点】(追加点) 64%

 右端が、記事として取り上げられる確率です。明石商・重宮君の決勝打は、記事になる確率が極めて高い、という判断をしました。基本的に、勝ったチームの場合は掲載の確率が50%以上のシーンを、負けたチームの場合は40%以上のシーンを抜き出して記事にしています。ただし、見どころが多い試合でもあまり記事が長くならないよう、シーンの数は、勝ちチームが3つ、負けチームが2つまでとなるよう、調整もしています。

 実際にできあがったのは以下の記事(画像4)。データを読み込んでから、記事ができるまでの1秒あまりです!

 【戦評】明石商対姫路工は6-3で明石商が勝ち、甲子園出場を決めた。明石商は1回、一死二塁から3番田渕翔のレフト二塁打で1点を先制した。姫路工は1点を追う2回、二死一、二塁から8番船曳崇斗のレフト二塁打などで計3点を挙げ、試合をひっくり返した。

 明石商は同点の7回、二死二塁から3番田渕翔のセンターヒット、なおも二死二塁から4番右田治信のレフト二塁打などで計3点を挙げ、逆転した。

武藤

 この記事、いまいちじゃない? 5回表、明石商・水上君の同点打という大事なポイントが抜けてる。記事になる確率が11%というのは、低すぎるよ。

ロボットくん

 ぼくの学習が足りなかったことと、もう一つ、学習の仕方が悪かったことに原因があるようです。大会期間中、戦評でTwitterでつぶやく一方、学習を続け、学習の仕方も見直していました。少しずつかしこくなっていたわけです。東西兵庫大会が終わった後、つまり最も勉強した状態だと、次のような記事になりました。

 【戦評】明石商対姫路工は6-3で明石商が勝ち、甲子園への切符を手にした。

姫路工は1点を追う2回、二死一、二塁から8番船曳崇斗のレフト二塁打などで計3点を挙げ、逆転した。

 明石商は2点を追う5回、二死一、二塁から2番水上桂の左中間ヒットショートエラーで2点を返し、試合を振り出しに戻した。同点の7回には二死二塁から3番田渕翔のセンターヒット、さらに二死二塁から4番右田治信のレフト二塁打などで計3点を挙げ、逆転した。

武藤

 一丁前の記者になったなあ。

ロボットくん

 でも実は、ぼくは記事を書くことが苦手です。例えば

「2回裏、姫路工は9番吉田海瑠のファーストゴロファーストエラー2塁ランナー本塁進塁で1点を挙げた。7回表、明石商は5番重宮涼のセンターヒットで1点を挙げた。7回表、明石商は4番右田治信のレフト二塁打で1点を挙げた...」

 このような文章なら、本物の記者よりも断然速く書くことができます。でもこんなのはただの羅列で、とても記事とは呼べない。スムーズに読めるよう、文章を修正しています。ただ、ゼロから記事を書くことを、自分で学習することはできません。開発者がプログラムした通りに、文章を出力しているだけです。たくさん原稿を書いて、文章が上達する記者とは、やっぱり違います。

武藤

 いやに謙虚やないか。

ロボットくん

 それに、いまのところぼくが注目できるのは、一打席速報の中の得点シーンのみ。ですから、完封負けの場合、負けたチームのことを記事にできないのです。この夏、14試合の戦評を発信しましたが、完封試合が5試合ありました(思ったより多かった!)。東兵庫大会の決勝戦(画像5)もそうでした。

 【戦評】報徳対市尼崎は2-0で報徳が勝ち、甲子園出場を決めた。報徳は5回、一死満塁から3番長尾亮弥のファーストゴロファーストエラーで2点を先制し、この得点を守り切った。

 せっかくの決勝戦だったので、もっとじっくりとした記事を書きたかったのだけれど、いまのぼくには、これが限界でした。でも、同じ完封負けでも、何度も得点圏に走者を送ったもののあと一本が出なかった、という試合もあれば、相手投手が抜群のピッチングを見せ、チャンスらしいチャンスをつくれなかった、という試合もあるでしょう。

 完封負けしたチームも精いっぱいの試合をしたのだから、記事に書きたい! 大会後も、すぐに勉強を始めていて、秋の大会までには、できるようになりそうです。

総合の最新
もっと見る

天気(11月16日)

  • 18℃
  • ---℃
  • 0%

  • 19℃
  • ---℃
  • 10%

  • 19℃
  • ---℃
  • 10%

  • 19℃
  • ---℃
  • 0%

お知らせ