103

文字を奏でる再生装置

一年ちょっと前に「文字起こし職人は不要になるか?」という話を書いたが、
http://d.hatena.ne.jp/note103/20110116/1295171011

iPhone4Sや今回の新iPad、およびGoogleの音声検索の機能向上などの流れによりこれはかなり現実になっていると思われるのだがあまりそういう話を聞かない。まあニュースや人の話自体あまり聞く機会がないから、かもしれないし文字起こし業界(あるか知らない)では話題沸騰なのかもしれないが。

とくに新iPadなんてただそれの近くで喋ればどんなに粗くてもいちおう文章になるわけで(持ってないから想像だが)、ラフに打ち込んだものを修正していくなんて工程は現状の起こし業界(知らないが)でも普通にたどっている作業なのだからやることがまるでバッティングしている。
というか問題はむしろ起こしの人ではなく、起こしの人を客として見込んでいた音声認識文字変換マシンの開発者(社)にとってこそ重大であるかもしれない。新iPad一枚あればラフな起こしがサクサクできるわけで、現状その精度がどんなにダメだったとしてもアップルなどの進化速度を超えるスピードで開発&リリースすることができるのかどうか。

上記の記事でも書いた気がするが(書いてないかもしれないが)、最初の粗起こし(あらおこし)なんて誰がやったっていいのでそれは新iPadさんだっていいということになる。粗起こしなら誰がやっても同じ物ができる、という意味ではなく、起こす人やマシンやタイミングによってある程度の違いがでたとしてもその違いが結果にそんなに影響しない、というかその後の作業がほとんどすべてなんだから、という意味で。
無論、プロの起こし人が(いるなら)最初の粗起こしの段階ですでに修正も構成編集もほぼ同時に出来てしまうのだ、ということならまた話は若干変わるが、そもそも編集という作業はおそろしくたくさんの情報を同時並行かつ複雑な仕方で取り扱う作業なのでそれを機械と比べること自体できないというか無意味だろう。

ちなみに文字起こしをする機会(チャンスの方)というのは編集者やその専門職などにかぎらず、学生や研究者なんかも研究上生じるインタビューの起こしなどで経験しがちな、さほどマイナーすぎるものでもないものだと思われ、だからかつては起こし業者というのは結構需要があったと思うが今後はどうだろうか。
ぼく自身は他人が起こしたものをもとにそれを編集する、という作業がまるっきりできない、ということに先日気づいたので(遅い&これまでの話と矛盾してる)、誰かに任せることはたぶんないが、世の中にはベタ起こしは誰がやってもいい、と思ってるひとや実際そのとおりな現場はいくらでもあると思われ、その部分がこういうマシン、というか新iPadにとって変わられる可能性は充分ある気がする。

しかしそのように書きながら思ったが、構造は「起こし業者が新iPadに食われる」とかではなくて「起こし業者が新iPad的な何かを使うことでより作業がスピードアップ&サービス全体も向上する」とかかもしれないし、それならみんな幸せかもしれない。

ちなみに何で僕が最初の粗起こしを人に頼めないかというと、文章とは頭に流れる音楽のようなもので、音声を文字に変換していくときには自分なりに採譜しているような感覚がある。採譜というか、つまり2次元の文字上で音が鳴っているようにするというか、レコード盤に溝を彫りつけているような感じというか。そこに目から視線を投げ、PCスクリーンなり本の紙上の文字にぴた、とそれがあたり、徐々に左から右へ、あるいは上から下へ、レコード針が動くようにぴた、とあたったその点が動いていく。溝をさわる針が空気を震えさせる音を生み出すように、文字上をたどる目から出た点はやはり音(ないしそのようなもの)を生み出し、生まれた音(のようなもの)は頭の中に流れている。
それが音楽なのかどうかは聴く人によるが、ぼくの頭にはそのとき音楽(のようなもの)が流れており、文章をつくるときには他人が喋ったことであれ自分が考えた(つもりの)ことであれ、再生されてほしいように再生されるまで、譜面を直すようにせこせこ(ときにはバッサリ)直していくことになる。
最初の粗起こしを他人がやった場合、それを目でたどったときに流れる音楽(のようなもの)が、自分の想定していたものと致命的に違っている、ということが少なくない。テンの打ち方とか漢字仮名の使い方とかの違いもあるが、それが仮にかなりの程度一致できたとしてもやはり「いやー、そういうテンションじゃないんだよな」的な感想がもれがちになる。
そしてそのような状況から自分の望む音楽(のようなもの)になるよう書きなおすというのは結構ホネで、だったら最初から自分でやりますよ、というようなことになる*1。だから粗起こしだからって誰がやってもいいということにならない。

ただしこれについては僕の頭の中にある(かどうか知らないが)文字の再生装置が結構融通の効かないやつだっていうことにすぎないのかもしれない。いいとか悪いとかではなく、ストライクゾーンがすごく狭い感じというか。

*1:あるいはこれはみそ汁の味を決めることにも近いかもしれない。一度他人が決めた味を自分の望むように直すのは難しい。塩や砂糖をどれだけ加えるより最初から味を見ながら作ったほうが理想に近くなる感じというか。であるなら料理人の頭には、その料理を舌にのせたとき自分だけに聴こえる音楽(のようなもの)が流れているだろうか。