103

2016-11-17 Thu:

  • 雨宮さん、残念だ。同世代で、ある種の目標というか、指針というか、憧れのように見ているところがあった。
  • Facebookトラベラーズノートを紹介していて、それを見て僕もそれを買ったのだった。
  • 好きなものに囲まれて生活するという、言えば簡単に言えてしまう、でも実現するのは相当な困難でもあるそれを、コツコツ実現している人だった。
  • モノ、服、住む場所、考え、自分の生きたいように生きるとはどういうことか、その難しさと、価値を示してくれる人で、それを自分に年齢の近い異性が、この現実世界でやっていて、これからどうなっていくのか、その姿をぼく自身にも反映・影響させるようにして、遠巻きに眺めていた。
  • 雨宮さんの書いた文章や、残した空気、考え方は、これからも消えずに、あるいは影響力を増しながら、生きていくに違いない。ぼくもまた、それとともに生きていこう。

2016-10-15 Sat: 音声入力を用いた文字起こしでブログ(2)

記録&ふり返り

前回に続き、掲題のトライ。
今回の流れは以下。

1 録音ファイル(26min)をエディット 45分
2 音声入力による文字起こし1周め(再生速度135%) 18分
3 音声入力による文字起こし2周め(再生速度135%) 15分
4 音声ナシで2,3のテキストファイルを統合しベーステキストを作成 7分
5 音声を聞きながら(再生速度80%)テキストを粗く修正 30分
6 音声を聞きながら(再生速度80%)テキストを本格的に修正 50分
7 音声ナシでテキスト整形(1文あたり100字前後で改行) 16分
8 音声を聞きながら(標準速度)仕上げ的修正 31分
9 音声ナシで表記統一(textlint使用) 6分
10 音声ナシで仕上げ(段落分け・タイムスタンプ挿入など) 17分
235分

前回は10分程度のファイルで、文字起こし完了までにかかった時間は115分だったが、今回は20分強の内容を4時間弱で起こしたので、それぞれほぼ2倍ずつ。

下記の起こしでも言っているように、自分では「録音の時間が2倍になったからといって作業時間も2倍になるわけではないはず(もっと短時間になるはず)」と言っていたので、思いきり見込みが外れて笑った。

記事の最後でまたSoundCloudで元音声を公開しているが、最近、仕事部屋のすぐそばで特大の工事が行われており、『ポーラX』(映画)のようなインダストリアル・ノイズが鳴り続けていてけっこうシュール、というかうるさい。

内容じたいはいつものような、実があるんだかないんだかわからないようなものだけど、いずれにせよ、こういうものをほぼ4時間かけて作る、というのはなかなかモチベーションが維持されないので、もし次回以降まだ続けるなら、もう少し時間を短く区切ったほうがいいかもしれない。

より直接的な狙いとしては、上の工程における10ステップをもう少し洗練させて、あまり考えなくてもシステマチックに作業できる体制を作ってみたいところ。

文字起こしのプロになりたいわけではないのだが、今までぼんやりやっていたこと、しかもけっこう本格的に消耗していたことを、意識的にシステム化してラクに対応できるようになったら面白いなと思って試みている。

上記工程表のステップ9でtextlintについてメモしたが、その辺の詳しい内容については別途まとめてみたい。(というようなことをいつも言っているが)

transcript

# 0:00

  • はい。ええとですね、この前、と言っても何日ぐらい前ですかね。ブログで文字起こしを、自動でっていうか、自動じゃないんですけど、音声入力でですね、文字起こしをちょっとでもラクにしようみたいな試みをしてるやつのサンプルというか、実験というか、お試しというか、自分で実験、自分の話で実験しようというやつの第1回というんですかね。やってみたんですけど。
  • そのときは、ちょっと時間ができたときにやったんですけど、別件がすぐに入っちゃって、話が中途半端なところで止まっちゃったんですけど。
  • 7分ぐらい。7分10秒ぐらいとかの音声ファイルを対象に作ってみたところ、音声入力による文字起こしで、合計115分。けっこうかかってんじゃんと思ったんですけど、今見直すと、実質、本格的に作業してるのは60分ぐらいですかね。
  • その115分のうちの最初の30分ぐらいは、音声ファイルのエディットで使っているので、まあ通常、文字起こしの音声ファイルっていうのは生データっていうか、外に出ることは普通ないものなので、そこはだいぶ削れるかなとは思うんですけど、とは言ってもまあ、30分が10分になる程度かな。かもしれないんですけどね。
  • あと、最終的にぼくのは7分ちょいになりましたけど、実際はけっこうだらだら喋っていてですね。ネタは全然カットしてないんですけど、空白部分とかを、なんかあるんですよね。音声エディット用のソフトウェアで、空白を詰める機能みたいのが。たまたま発見したんですけど、普通にありまして。
  • それでそのぐらいになったので、元々は10分弱ぐらいだった気がするんですけど。なので、そのぐらい、10分ぐらいだらだら喋ったものを、まあ最低限というか、起こすと、115分。まあ120分ぐらいかかったと。なので、12倍? 12倍っていうか、10分の内容が2時間だということですね。
  • ただ、そのブログにも書いたんですけど、この時間がですね、増えて、たとえば20分のデータ、30分データってなったときに、2時間だったのが4時になり6時間になり、ということになるかと言えば、たぶんそういうことはなくて。初期費用みたいなものがけっこう大きくて、電話の基本料金みたいなものでですね、固定費的なものの時間がたぶん、あるんですよね。
  • だから、変動費ではない部分がけっこう大きくて、変動する部分だけが2倍3倍になっていくという感じだと思うので。
  • じゃあ20分だったら、30分だったらっていうのも本当は試したいんですけど、それはそれでけっこうコストがかかるので。いつ試せるのかなーっていう感じですけどね。

  • ええと、この前ですね、録っていた話の、最後ちょっと中途半端になっちゃったなっていうところがですね……ああ、そうそう、機械がその音声入力とかによってですね、あとぼくがやってるのはただ単に音声入力できるねっていうだけの話っていうよりは、もう機械の中で自動的に、なんと言うんですかね、まあそこが自動なんですけど、機械にmp3とかのファイルを入れて、アップして、そしたら機械がそのまま読みこんでテキスト化してくれると。
  • そういうこともまあ、ちょっとだけ足を踏み入れてはいるので。勝手にやってくれるっていうか、まあ再帰的に。
  • その要素がですね、たぶん突き詰めれば、人間がやってることがだいぶ減るよねっていうことで。なんだけど、やっぱり同音異義語とかは、どうしても調整の手間がかかるはずだし、そこは人間のやることとして残るかなあ、みたいな感じで話が終わったんですけど。

# 5:00

  • ただ実際はですね、その同音異義語にしても、大抵は文脈で判断できるわけなので、機械のほうでもですね、どうなんでしょうかね、機械学習とかってそういうものなのか、どうなのか、よく知らないんですけど、機械学習とかのそれを使えば、あるいは使わなくても、この文脈だったらこれだよっていうのが判断できればいいだけなので。
  • まあ、同音異義語もそうだし、あとはたとえば、この対談はミュージシャン同士だから、この話題のこの単語はこういうやつに決まってるよ、とか。あるいはスポーツ選手同士だから、この単語はこれだとか。専門領域ごとにですね、ちょっと初期設定を変えておけば、同音異義語で変なのを拾ってくる余地も、まあ減ってくるだろうなとも思うし。
  • その意味でも、人間のやることはまあ、減る一方なのは間違いないんじゃないかなあ、ということは思ってるんですけどね。
  • とは言っても、今この段階では、あまりにもちょっと面倒くさいよなあ、と。面倒くさいことが多すぎるんで、そんなすぐは、たとえば文字起こしを専門的にやっている人がすぐに仕事を失うかというと、そういうことはない、むしろ、たぶん過渡期的に、今なんかやけにすごい、やけに文字起こしの需要が多いんじゃないかな、とじつはまあちょっと思っていて。
  • なんか文字起こしを依頼したい人、自分は起こしたくないけど、これ起こしてほしいなっていう需要がけっこうあるような感じをひしひし感じなくもないんで。
  • たぶんまあ、それをいずれ機械が引き受ける方向で、誰かが頑張って開発したりするんだろうな、とも思うんですけど、それが形になるまでのその過渡期というか、ところをね、誰が引き受けるのかなって、すごい、まあできる範囲ではぼくも何かしらやりたい気はするんですけどね。
  • 需要はなんか、ある気がするんですよね。文字起こししてほしい、と。そのままどっか公開するわけではないんだけど、あるいはそのままどっか公開するんでもいいんだけど、いろいろ録った音声を、テキストにしたいんだよ、みたいな感じがね。なんでかなあと思わなくもないんですけど。
  • まあ、発表できる場所が先にできたってことなんですかね。そのブログでも、Webメディアでも。もう発表する場はあると。で、ネタもあると。誰かがどっかのカンファレンスで喋ったとか。でもそれを、テキスト化する人がいない、みたいな感じなのかなと。

  • ぼくは……ってその文字起こしの話の続きなんですけど、ぼくは初めて文字起こししたってのが2000……あれは2004年かな。
  • 菊地成孔さんというジャズミュージシャンの方が、東京大学でジャズの講義をしていまして。ぼくはちょうどその少し前ぐらいに菊地さんの活動を知ってですね。ちょっと、まあ追っかけというほどでもないんですけど、活動をチェックしていたら、なんかたまたまそれ、もぐれるぞ俺、みたいな。時間あるぞ、という感じで。もぐってたんですよね。その東大の講義に。
  • で、その講義の様子を文字起こししようかなみたいな感じで。なんとなくそういうふうになってですね、それでやりはじめたのが一番初めで。
  • それをネットにHTMLとかで、書いて公開するってのをやってたんですよね。
  • まあ、よくよく考えると、ぼくはプログラミング入門の話とか、最近けっこう好きでしてるんですけど、2013年ぐらいからプログラミング入門したぞとかって言ってたんですけど、HTMLはもう2004年から書いてたなって思い出したので、なんかいろいろ記憶が錯綜している部分もあるんですけど。

# 10:00

  • いずれにしてもそのときに、文字起こしを、もうそれは完全に趣味でやってて。で、その頃からよく思ってたんですけど、なんで文字起こしをやってるの、好きなの、みたいなことでですね。またちょっと話が飛ぶんですけど。
  • ぼくは美大に通ってたんですよね。油絵科だったんですけど。その美大がですね。武蔵野美術大学って言って、けっこうなんだろう、もっさりした……もっさり……学生さんは普通に若者なんですけど、油絵科がですねえ、まあ古き良き、まあ武蔵野っていうぐらいなので。そんなにすごいかっこいいとかじゃないんですよね。
  • タマビとか、東京造形大学っていうのがその頃、まあ東京芸大っていうのが、トップオブトップ、美大の中の美大、むしろ芸大みたいな感じで、そこはもう突き抜けてかっこいいなあ、という感じなんですけど。他の私立大学の美大だと、タマビとかですね、造形大っていうのは、なんかおしゃれだなっていう感じで。
  • ぼくは75年生まれで、美大に入ったのは95年とか。二浪して入ったので。その頃受験してた人たちは、なんとなく、もしかしたら共感してくれるかもしれないんですけど。今は全然、どうか知らないんですが。武蔵野美大はですね、ちょっとそういう中では、レベルはけっして低くはなかったと思うんですけど、そんなかっこいいような感じではないというか。
  • おしゃれという感じではないけど、まあ、手堅いよね、みたいな感じなのかなと思ってまして。まあ、地味? 地味っていう感じかな。でもぼくは地味なのがけっこう好きだったので。ムサビに行ければいいなって思っていたんですけど。
  • で、そのムサビがですね、たしか入ったときの、受験のデッサンのですね、木炭デッサンとかで描くんですけど、課題が自画像だったんですよね。で、ぼくは自画像がすごい得意だったんですよね。もう予備校の頃からもそうだし。それで何とかパスして、なんかべつにもう美大で描きたいこともないけど、ずっと自画像描いてればそのうち芽が出るかな、みたいな感じで、思った記憶をすごく覚えていてですね。実際は自画像どころか、絵をほとんど描かなかったんですけど。
  • んで、なんでその話なのっていうと、その自画像と文字起こしってけっこう似ているなあという感覚が自分ではあってですね。自画像って、かなりコストがかからないものなんですよね。風景画は外に出なきゃいけないし、人物画はモデルさんが必要だし。まあ写真で描いたりする人もいるとは思いますけど、いわゆる人物画は、まあモデルさん、生きてる人に協力してもらったりするのも面倒だし。
  • あとなんだろう、静物画。物を描くとかは、物をセットしたままじゃなきゃいけないのもけっこう大変だけど、自画像って自分だけいればいいので。鏡と自分と画材があればいつでも好きなだけ描けるんですよね。
  • で、文字起こしも、その必要な音声と、書くための機械があればいいだけなので、本当に自分の都合で好きなだけできると、いうところがあってですね。
  • あとはまあ、音声をテキストにするっていうことは、「別の物」にしているってことなので、どれだけ近づけてもですね、終わりがないんですよね、文字起こしってのはね。音なので、音を文字にしているので、それって結局、たとえば「りんごを絵に描きましょう」って言って、これむちゃくちゃ上手いね、このリンゴの絵、すごい本物みたいだねって言っても、まあ紙なので、紙またはキャンバスと、その画材。絵の具とか。なので、どこまで行ってもリンゴそのものではないわけですよね。
  • だから、ものすごい写実的にむちゃくちゃ上手く描くっていうことと、ものすごい細かく文字を起こすってのは、すごい似てる。で、どっちもぼくが好きな作業っていうか、ひたすら似せていくというかですね。で、終わりはないという。なぜなら、別物だからっていう。そのあたりがけっこうフィットして。まあ地道にですね、ちまちま絵を描くっていうのと似てる、ところがけっこうフィットして。まあ好きでやってんだなあとか思うんですけどね。

# 15:00

  • で、その音声入力とか、あるいは自動入力で、勝手にテキスト化してもらう、マシンにしてもらうとかっていうのは、ある意味その、自分で自分の首を締めるというか、率先して息の根を止めにかかってるような感じもなくもないんですけど。
  • やっぱりでも、それでも残るのは何なのかな? っていうのを早く知りたいっていうところがけっこうあっでですね。
  • だからもう完全に、そんなの人間がやらなくていいんだよっていう状況になったらなったで、じゃあその先って何があるのかな? みたいな。それでも文字起こししたりするのってどういうことなのかなって、やっぱり知りたくなるというか。そういうところにけっこうひかれてるのかもしれないですけどね。

  • それでまあ、ちなみにっていうか、時々、とくにその自動文字起こしとかを試しはじめてからちょっと思うのは、文字起こしとですね、ぼくは今、坂本龍一さんの音楽全集っていうので、ブックレット、CDブックのブックレットを中心に編集してるんですけど、まあCDの方もちょこちょこいろいろ、やることはやっているんですが、その編集っていうのがですね、結局、さっきも言った、音をテキストにしていくという文字起こしというのが、もうこれはすでに編集でもあるんですよね。
  • たとえば、括弧笑いって、なんか笑いながら喋ってるなって思ったらとりあえず「(笑)」を入れとくかって感じになるわけですけど。なんか、クスクス笑ってるのか、大受けしているのか、嘲笑っているのかによって、でもそれ、全部「(笑)」でいいのかなあとか。
  • あるいはまあ、そもそも「(笑)」を入れずに笑ってることがわかるようにしたほうがいいんじゃないかなあ、とか。いろいろ考え始めると、それはすでに編集。「(笑)」をここはとっておこう、という判断はもう編集だし。
  • あとはなんか叫んでるからビックリマーク入れとくか、というのも編集作業ですよね。だから、一字一句変えずに、「ああ」とか「うーん」とかを全部仮に入れていたとしても尚、なんでそこで句読点入れてるの、とかはもう編集作業なので。
  • だから、そのままその、「文字起こし」がどこまでマシンに奪われるのかっていうのを考えると、じゃあ「編集」はどこまでマシンに奪われるのかなっていう課題にもなっていくというか。まあ課題っていうか、想像する対象としてですね、あるので。
  • そうすると、そこまでまた考えると、いろいろさらに面白い。それ、人間がやる必要あるの? みたいな感じがですね、考えられて面白いなあと。
  • やっぱりその、たとえば「リンゴ」って誰かが言ったときに、「リンゴ」ってテキストに起こすのは編集なのか? って言うと、それはただ文字にしただけですよねって、まあぼくだったら思うんですけど。
  • でも「リンゴ!」っていきなりでかい声で喋ったら、じゃあそこはビックリマークで、「リンゴ」の後に「!」入れてやれっていうのはまあ、そこは編集かもしれない。
  • でもその違い……違うんだけど、違いは、なんだろう。そんな明白に、階段の段差みたいに違うわけじゃなくて。線が間に引かれてるとかですらなくて、明らかに違うんだけど、その境界線はなんかよくわからない、みたいな。
  • だから時々、喩えで出すんですけど、「右手と左手の境目はどこなの」っていうと、右手と左手はまあ明らかに違うんだけど、ずっと体を辿っていくと、継ぎ目とかはないわけですよね。
  • どっかで誰かが、体のちょうど半分の、みぞおちとか、鼻のラインとかで分けましょうって決めれば、じゃあそこから右にしましょうって言えるんだけど、ずっと肌を辿っていくと、まあ右手の中指の先から、左手中指の先まで、地続きになっているわけで。どっちも右手の一部だよっていうことも言えなくもないみたいな。
  • その境界のなさみたいなものがですね、「文字起こし」と「編集」の間にはある。どこからどこまでなのかなって。
  • なんかそういう、じゃあどこまでがマシンに任せられるのかな? とか。どこまでがやってて面白いのかなとかですね。考えているとけっこう、興味が尽きないというかですね。そういうことも考えつつ、まあいろいろ試しているというところですね。

2016-10-10 Mon: 音声入力による文字起こしで雑記

以前に以下で紹介した方法を使ってひさしぶりに音声入力による文字起こしを試してみた。

note103.hateblo.jp

モチベーションは大きく二つあり、ひとつは最近このブログで書くような雑記的な話を書くに書けなかったので、それを音声経由でサクッと更新してみたかった、ということ。

もう一つは、その音声入力方式を使うと、実際にどの程度、文字起こし作業の効率が上がるのか、多少なり数値化してみたかった、ということ。

具体的なレポートは上の記事と同じプログラミング関連のブログであらためてまとめたいが、ざっくり報告すると、今回素材として使ったのは7分強の音声ファイルで、以下のような流れだった。

1 録音後の音声ファイルをエディット 30分
2 音声入力による文字起こし1周め 10分
3 音声入力による文字起こし2周め 10分
4 2,3でできた2本のテキストファイルを統合してベーステキストを作成 5分
5 4でできたベーステキストを粗く整形(音声を標準速度で聞きながら) 15分
6 5でできたテキストを本格的に修正(音声を80%でスロー再生しながら) 20分
7 6でできたテキストを音声ナシで修正 10分
8 7でできたテキストを見直し(音声を標準速度で聞きながら) 10分
9 テキストの仕上げ(段落分け・タイムスタンプ挿入など) 5分
115分

このうち、1は音声自体を公開する必要がなければだいぶ短縮できるはず。

ただし、無音部分を圧縮(削除というか)したり、素材音声の全体的な構成をつかむのには役立つので多少はやっておきたい。(ソフトウェアはAudacityを使う)

2と3で音声入力したテキストを2本用意しているが、1本だけだと取りこぼしがけっこう気になるので、2本取っておいて、4の工程でその取りこぼしを埋め合っている。

その4ではUNIX/Linuxコマンドのdiffを使う。

音声を聴きながら作業するのは5,6,8の3回がメイン。とくに6の、スローで聴きながらすでにある文章をバリバリ整形(修正)していく作業が個人的にはヤマ場と感じられた。

合計すると、115分。実際の作業より少し多めに取っているが、準備その他を考えたら大体そのぐらいかもしれない。

7分強の内容を一気に起こすだけなら、そして以下に示す程度の精度で良いとすれば、プロなら30分もあれば充分だろうし、普段こういう作業をしない人でも1時間ぐらい集中すればある程度は起こせるかもしれないので、115分というのは長すぎるかもしれない。

しかし素材ファイルが数十分、数時間に膨れ上がり、作業時間が数日にわたった場合にどうなるか、というとその開きはだいぶ狭まるかもしれない、とも思う。

とくに、上記ステップの「5」が完了するぐらいまでの作業者の負担は、だいぶ軽減されるのでは、と感じる。

transcript

0:00

  • はい。ええとですね、ブログをこのところあんまり書けなかったんですけど。2週間ぐらいですかね。
  • 理由としてはですね、まあ単純に、仕事をけっこう一生懸命やって。そっちでもうリソースを使いきっていたという。
  • だいたいここ1〜2ヶ月ぐらい、もうちょっと前かな、からですね。パターンとして、ブログは夜ですね、寝る前に、もうあとは寝るだけだっていうときにダラダラ〜っと書いて。
  • で、翌日仕事を始める前に、まあ30分ぐらい読み返して。必要に応じてちょっと直してですね。それで公開っていうふうにするパターンが多かったんですけど。
  • このところはすごい、その、まあ仕事っていうか、スコラっていう音楽全集を作っているんですけど。
  • それがですねえ、無茶苦茶ピークで。ピークがもう1ヶ月ぐらい続いてて。まだ続くんですけど。それをやりすぎてですね。その寝る前に、「さあブログでも」って、けっこう書き始めたりはするんですけどね。
  • で、普通は、ここしばらくっていうか、ブログをちょこちょこ書いてた頃は、書き始めるとけっこう、あれもこれもっていう感じで。ネタって言うんですかね、出てきて。もうこんなもんでいいやというところで止めてたりしたんですけど。もう疲れきってですね。全然そんなふうにならない。ならないんですね。
  • だから、まあそれだけピークだったのかなと。でもまだ全然、過去形ではないんですけど。

2:20

  • まあでも、ネタじたいはけっこうあるんですよね。というのはまあ、Twitterでもちょこちょこなんか書いたりしているようにですね。してるんですけど。
  • ああ、この問題はこういう考え方のほうが、なんかいいよなあ、とか。さっき見たあれは、こんな感じだなあとか。
  • まあいろいろ、雑念というんですかね。雑な見解がいろいろ浮かんではくると。
  • で、前はそれをそのブログにチラチラと書いたりしてたんですけど。
  • あとはあの、プログラミング関係のこともですね、本当はあれも気になる、これもやっておきたいとか、いろいろあるんですけど。まあ全然できなくって。
  • まあプログラミングの方はですね、多少その手元でコードを動かして、ちゃんと確かめながらじゃないと、あんまり記事にできなかったりするんですけど、そうじゃなくて、ちょっと思いついたこととか、まあ時事ネタ的なことだったら、一回これ音声に録ってですね、それを公開すれば、まあなんというか、ネタがあんまり溜まりすぎないんじゃないかなあと。ふと思ってですね。
  • それでこれをちょっと録音してみてるということなんですけど。

3:45

  • けっこうその、ちょっと前にぼくは文字起こしを機械にやらせる方法、みたいな感じで、ちらっと書いたらけっこうブックマークがついたりして。
  • 評価というか、評判? というか反響というか、あったりしたので。
  • でも本当にそのあと、かなり忙しくなっちゃってですね、あんまり追加的な話ができなかったので。
  • ですけど、実際にはその後、もうちょっと展開してて。自分の中では。自動でできる部分をもう少し増やしたりとかしてたんですけど。
  • なんか、だからそれを使ってですね、この一回録ったやつを、まあそのまま音で流すというのも悪くはないんですが、それよりはっていうか、文字起こししちゃって、文字起こしのスキルも高めつつですね、まあ「文字起こさせ」っていう感じですけど。自分ではそんなにやらないので。
  • というのも兼ねちゃっても面白いかな、ともちょっと思っていたりしますね。

5:00

  • それで、その「文字起こさせ」なんですけど。結局その、元々の記事で書いたやつってのは、大変なんですね。文字起こしってとにかく。
  • ぼくはまあ、それでも好きと言うか、けっこう向いてるなあとか、自分で思ってたので。まあ思ってるんですけど、まだ。
  • それはいいんだけど、ええと、大変なんですよね。
  • 大変っていうのは、時間がすごいやっぱりどうしても、あの、人間が走るとですね、100メートル、どうしても9秒はかかる。9秒より速くは、まあ基本ならない。5秒とかにはならないってのと同じで。
  • もうこれ以上短くできません、みたいなところがあるわけですね。
  • で、文字起こしっていうのはそれがけっこう明らかで、どんだけ才能があろうがですね、どんだけ楽しんでやっていようがですね、これ以上は短くできない。で、最低限このぐらいの労力はかかると。疲れる。このぐらいは疲れますどうしても、っていうのがまあ、あるんですよね。
  • で、じゃあそれに見合った成果というか、評価を受けられているのかって言うと、なかなか難しいところがあるかなと。
  • で、なおかつ、たぶんもうどう考えてもですね、文字起こし。その音声をテキストにするなんていうのはですね。人間じゃなくてもできる。ように必ず、こればっかりは100%と言ってもいいかなと思うんですけど、まあそういうことにはなると思うんですよね。
  • ただもちろんっていうか、間違い、同音異義語っていうんですかね。箸と橋とかありますけど。雨と飴とかですね。
  • まあそこの調整っていうか。そこの誤植的な、誤字脱字的なことはまあどうしても出てくるのは、それはそうですけど。

ブロマガ退会に2度失敗した

  • 今年の6月初め頃、ある人がブロマガとnoteで有料コンテンツの連載を始めるというので、少し迷ったがブロマガの方で購読することにした。
  • ブロマガとnoteの連載内容は同じで、ようは一つの有料メールマガジンを複数のプラットフォームからリリースするようなものである。
  • ブロマガの方はすでにMIAUで有料記事を購読をしているのと、noteの方はいろいろ調べてみたもののちょっと不明確なところがいくつかあるように感じたので、とりあえずブロマガにした、という感じ。
    • noteの何を不明確に感じたのか、ということはもう忘れてしまったが。
  • 8月の初め頃になって、ん〜、あんまりちゃんと読まないなコレ、と思い、一旦解約することにした。
  • どこから解除すればいいのかな、と設定ページをめぐって、コレと思われるところがあったので、解除手続きをした。
  • けっこうサクッと(ほぼ1クリックで)終わったので、随分簡単だなと好印象を持ったのだけど、後から知ったところでは、これはメール配信を解除しただけで、有料購読の契約はまだ継続されていた。
  • 9月の後半に、別の有料ブロマガが面白そうだったので、それを購読してみた。その後、10月に入って、ん〜、これもあんまり読まないな、と気軽に、かつ以前やったのと同様に契約の解除を行った。
  • すると、今度はその直後に「この手続きで解除されるのはメール配信だけであり、契約は継続されている。よって契約を解除したいならどーしたこーした」という文言が画面に出てきた。
  • 以前にもそのような文言が出ていたのかどうか、もう覚えていないが、少なくとも以前に解約した(つもりになっていた)ときにはそんな手続きをわざわざしていないので(1クリックで全部済んだと思っていた)、案内に沿って詳細を確認してみたら、たしかにまだ絶賛契約中だった。
  • ひえ〜、と思ってとりあえずそのすでに解約したつもりだったものを解約。
  • まあ、紛らわしいシステムであることには問題を感じるにせよ、これは受け入れざるを得ないレベルかな・・と自分を納得させつつ、ふと、「そうか、せっかく2ヶ月余計に払っていたのだから、その分の購読内容は受け取っておこう」と思った。
  • 具体的には、ブロマガには過去の購読内容をEPUB形式で、月単位でダウンロードする機能があるので、それを探しにいったのだけど、すでにチャンネルの解約が済んでいるせいか、ダウンロードボタンがあるはずの場所にそれがない。
  • 解約する前に気づいていれば良かったのかな、とも思ったが、もしそうならば、それに気づかず解約してしまった人(←俺)は、「解約する前にダウンロードしておいた人」と同じ金額を支払いながら、「事前にダウンロードしたかどうか」の違いだけで同じコンテンツを共有できないことになってしまう。これはちょっと、倫理的におかしいのではないか。
  • そう思って、念のためサポートに詳細を問い合わせてみることにした。
  • 果たして、サポートの回答はぼくの想像したとおりで、単純に「解約前にダウンロードしておけば保存できたけど、先に解約してしまうとそのコンテンツ(料金を支払った期間に配信されていた有料コンテンツ)にアクセスすることはもうできない」という。
  • 念のため、「もし同じアカウントで同じチャンネルに再入会したら、かつて料金を支払った期間のコンテンツにアクセスできるか?」と聞いたところ、「それもできない。再入会したら、再入会した期間のコンテンツだけがアクセス可能な対象である」という。
  • ブロマガ運営サイドの態度や方針は一貫しており、その点は良いと思う。まあ、ぼくの希望としては、「金額を支払った期間に発行された内容に対しては、解約後であってもアクセス可能であるべき」だと思うけど、「いや、ブロマガはそういうメディアではない。あくまでコンテンツにアクセスできるのはその契約期間のみであり、解約後もアクセスしたいなら契約中にコンテンツをダウンロードしておいてくれ」と言われれば、「なるほど。そういうやり方もあるんだな」と思うよりない。
  • つまり、ぼくが希望として挙げたシステムはモノを売買している。一度手にしたモノはお客のものになる。仮に契約中にダウンロードしていなくても(あるいはダウンロードしていたけど「保存していたマシンがクラッシュしてデータが消えた」というような場合でも)、必要なときにいつでも「すでに買った」コンテンツを呼び戻せる、という状況。
  • しかしブロマガが提供しているのはそういったモノではなく、音楽サブスクリプション・サービスのようなストリーミング・データ的なものなのだろう。そのデータはつねに流れ続けていて、形のあるモノではない。ブロマガが販売するのは、その流れ続ける、モノではない情報に触れられる「権利」なのであって、その権利がなくなればいつの期間の情報であろうともう触ることはできない。その上で、しかし契約中であればモノとして(EPUBデータとして)保存できるオマケを付けてあげるよ、ということだと考えればよいだろう。
    • 上ではマシンがクラッシュした場合のことを書いたが、それが心配ならばダウンロードしたデータを複数の場所にバックアップしておけばよい。その辺の工夫は客の自由なのだ。
  • ということで、ここで言いたいのはブロマガの方針がおかしい、ということではない。それは僕がつい数日前まで思っていた販売形態とは本質的に異なるものだったが、まあ、そういうシステムの商売があってもよいとは思う。
  • 問題は、そういったシステムであることがわかりづらい、ということだ。当然のことながら、「解約後には契約期間中に配信されたデータにアクセスできなくなる」ということがわかっていれば、それを保存してから解約しただろうから。
  • その辺りが改善されると、同じような思いをする人が減るかもしれない。
  • ちなみに、「有料チャンネルを解約したつもりがメール購読解除しただけだった(それによって支払っているつもりのない購読料を何ヶ月も支払い続けた)」みたいなことは他でもあったようで、FAQにも載っている
  • 8月に購読解除した段階で、注意を促す文言が出たかどうか覚えていない、とは書いたが、いずれにせよ元々はその注意文言もなかったのだろう。だからFAQに載るほど、そのような問い合わせがあったのではないかと想像している。
  • 今回は幸いにして、ほんの数ヶ月を置いたところで別のブロマガを購読&解除する機会があったから、余計に支払ったのは2ヶ月分程度で済んだけど、もしそのまま何年も続いていたら……と思うと結構ゾッとする。ちなみに、購読していたのは月800円以上するものだったから、何年も続いたらかなり痛い。
    • というか、今回の数ヶ月分ですら充分に痛い。さらにはその分の有料コンテンツには一度も目を通していないし、今後も目を通せる予定はない。
  • フォローというわけではないけれど、この不明点解消までのサポートとのやり取りは非常にスムーズに進んだ。最初の連絡をこちらからするまでのハードルはけっして低くないが、一度投稿できれば、そこからは早い。
  • 簡単に経緯を記しておくと、まず10/7(金)の正午にサポートへ第1投。すぐに自動返信で、「問い合わせを承りました」みたいのが来る。
  • そのおよそ6時間後、18時少し前に回答があって、「解約したらもう見れません」というシンプルな内容。
  • それを見て、「再入会したら以前の契約期間の有料コンテンツは見れるのかな」という疑問が湧き、回答メールに記載されていた「追加質問」のためのページへ移動。
  • この「追加質問」のフローがある、というのはとても良いと思った。初めから備わっていた機能なのかどうか知らないが、非常に実践的なアイディアであり、過去のサポート経験に裏打ちされたノウハウだと感じる。
  • なにしろ、今回がまさにそうだが、こういう時のユーザーは言わば未知の体験をしているわけで、一度の質問ですべての疑問について要領よく質問できるわけではない。この「追加質問」があることにより、ユーザー側もサポート側も、以前の質問からの差分だけで合理的に疑問を解消しやすくなる。
  • ということで、その「追加質問」から再入会にまつわる件をあらためて質問。この時点で18時を過ぎており、サポート関連の文言では「平日10時〜18時まで対応」とあったので、まあ返事は連休明けかなと考えていた。
  • しかし予想は良い方に裏切られ、翌日10/8(土)の14時過ぎに、「すみませんが再入会しても見られません」との回答が来た。
  • 回答内容に対しては上記のとおり、「ああ、そうですか」としか言いようがないのだけど、このように連休中に戻ってくるとは思わなかったので感心してしまった。むしろ運営会社、ちゃんと社員を休ませているのか一瞬不安に思ったが、まあ街に出れば土日に働いて平日に休むシフトの人もいるわけで、きっとそのようにしているのだろう。
  • 簡潔かつ明快な回答、かつ迅速に対応してもらったので、了解した旨の返事を先ほどと同じ「追加質問」から送っておいた。
  • こうした場合、向こうにとっては「了解したなら返信不要だヨ」という状況もありえるとは思うが、とくにそのように要求されていないのであれば、御礼もかねてこちらの結果や評価を伝えておくべきだと考えている。
  • サポートをした側も同じ人間なわけで、御礼を言われて嬉しいかどうかはともかく(そもそも本人に届くかもわからないが)、自分の回答が客のもとでどのような成果を上げたのか、ということを明確に知ることができれば、それを次以降の業務に生かしていくこともできるだろうから。
  • その最後の「追加質問」(というか連絡)を投稿した後、今回のサポートについて感想を教えてほしい、というアンケートがあったのでそれも回答しておいた。上に書いたような良点をいくつか。それから、回答は2通もらったのだけど、担当者はそれぞれ別の人で、後者の方が伝え方が丁寧だったのでそれも書いた。
  • ただ、元の質問や追加質問を書くスペースにはけっこうな分量の文章を書けるのだけど、この「アンケート」には200字以内で収めろ、とあったのでそれが数少ない悪印象だった。言いたいことを短くまとめる、というのはだらだら書くよりだいぶ負担が大きい。
    • まあ、読む側からすれば、コンパクトにまとまっていた方が読みやすい、というのはもちろんよくわかるが、その負担をアンケートの依頼をされたユーザー側がこうむるべきなのだろうか? まったくそうは思えない。
    • のだけど、その問題点も含めてぴったり200字で送っておいた。
  • タイトルに書いた「退会に2度失敗した」について蛇足的に説明しておくと、最初の失敗は「解約したつもりでメール配信を解除していただけだった(解約できてなかった)」ということで、2度めの失敗は「EPUBデータをダウンロードする前に解約してしまった(料金を支払った期間のコンテンツにアクセスできなくなった)」ということ。
  • これらの失敗を通じて、ひとまずブロマガのコンテンツを購読する際に気をつけておくべきことは把握できたと思う。それを踏まえた上で、また購読したいものがあれば利用したい。

Spotify無料プランの感想

はじめに

  • Spotifyが日本でのサービスを始めたので使ってみた。

www.spotify.com

  • まだベータ版状態というか、誰でもすぐに使用できるわけではなく、事前に待機リストに登録した人順、という感じらしいが。
  • 以下、雑感をつらつら書いてみる。

類似サービスとの比較

  • 第一印象としては、なかなかいい感じ。音楽サブスクリプション・サービスの特徴と言える、「何曲聞いても定額(または無料)」や「独自のレコメンド・リスト」などの機能を通して知らない音楽にどんどん出会える。
  • これまでこの手のサービスではApple MusicやAmazon MusicAWAなども試したが(LINE Musicも一瞬)、このように選択肢が増えるのは純粋にいいことだ。
  • 今まで使った中では、レコメンド機能的な部分ではApple Musicが一番面白かったと思っている。しかし、残念ながらApple Musicは音楽再生プレイヤーであるところのiTunesとの相性がすさまじく悪い。社内での連携が取れていないのだろう。
  • ぼくはiTunesを消去法的に常用の音楽プレイヤーとして使っているので、その機能性を低下させるApple Musicを使うことができない。残念。*1
  • Amazon Musicはカタログとしてかなり偏りがあり、「あの曲を聴きたいな」とふと思ったときにそれがない場合が多い。しかし、ぼくは仕事の都合もあってプライム会員にはなっているので、追加の金額を払うことなくフルでこのサービスを使える。そしてまたAmazon Musicにはなぜかやけにジャズ系の品揃えが多く、またポップスやロックもそれなりに(バラつきはあるにせよ)あるので、結局これが無難な落としどころかな、という感じになっている。
  • Apple Musicを諦めてしばらくした頃、AWAが出てきたので、Amazon Musicに並行してAWAも使っていた。
  • AWAというのはぼくがscholaを作っている版元のavexが主導しているサービスのようで(よくは知らない)、それなりに信頼を置けるので数ヶ月有料プランで使っていた。*2
  • 使い心地としてはApple Musicに近くて、一部ながら歌詞もちゃんと表示されるし、品揃えも洋邦を問わず多くてけっこう気に入っていたのだけど、少し前からMacアプリがやけに重くなってしまい、ぼくは主にMacAWAをかけていたのだけど、他のどのアプリを使っても発生しないぐらいファンがけたたましくうなるようになってしまい、それがまたAWAのアプリを起動するたびに再現するのでたまらず有料プランを解除した。以後使っていない。
  • そんな中でのSpotify。なので、自分としてはApple MusicやAWAの系譜に連なる、品揃えの多い&使いやすいサービスとして期待した。
  • 果たしてその期待は裏切られることなく、レコメンドされるプレイリストも、ちょっとあれ聞きたいなと思ったときにそれがちゃんとあるという品揃えも、基本的には申しぶんのないものだった。
  • 意外な長所としては、無料プランだと曲間で定期的に音声のCMが入るのだけど、これがYouTubeTwitter、あるいは各種バナー広告にあるような下品なものではなく、クオリティの高いものが多い。この感覚は何に似ているかというと、ラジオCM。最初はAMラジオのそれに近いかなと感じていたが、最近はFMっぽいかなと思っていた。(とくに根拠はない)

Spotifyのまずさ

  • そのような感じで、今日まで3日ほどだろうか、ほとんど悪印象もなく楽しめたので、有料プランに換えてもいいかなと思い始めていたのだけど、つい数時間前、突然「無料で楽しめるのは残り1時間です! 無料プランでは月に15時間しか聴けません!」みたいなアラートがMacアプリに出てきて、ええ〜という感じになった。
  • いや、無料プランに時間制限があるのはべつにいいのだけど(たしかAWAの同様の制限に比べたら15時間というのは破格に長い)、無料プランと有料プランの違いを示すいくつかの場面において、この制限のことがほとんど記されていないのだ。
  • 通常目に入る場所で示される、無料/有料の違いはこの程度。月に15時間までなんてどこにも書いてない。

f:id:note103:20161008233549p:plain
f:id:note103:20161008233559p:plain

  • わざわざヘルプのこの辺に行ってようやくわかる。

f:id:note103:20161008233641p:plain

  • つまり、時間制限の存在というのは実際にその15時間を使い切る頃になってようやくわかるようになっている。これはちょっと、印象が悪い。急に熱が醒めてしまった。
  • 悪意はないと思うが、利用者からすれば騙されたように感じてしまう。Spotifyに限らないことだが、有料と無料それぞれのプランを選べるようにしている場合は、その違いがひと目ですべてわかるようになっているといいと思う。
  • ということで、有料プランへの切り替えは一旦見送り。もう少し熟考してみる。

Spotifyの良さ

  • フォローというわけではないが、良い点もあらためて明記しておくと、Spotifyの良いところはやはり品揃えの良さ。そしてアプリの使いやすさだろうか(Mac用もiPhone用も)。
  • Apple Musicはどうだったかもう忘れてしまったが、Amazon MusicAWAの場合、その直前までMacで聴いていた続きをその後iPhoneアプリで聴く、というのが出来ない。デバイスごとにその辺の管理がバラバラになっている。
  • これは電子書籍を読んでいるときにも感じることだが、デバイスが変わっても直近まで触れていた内容の続きにすぐアクセスできるかどうか、というのはその体験を大きく左右する。
  • 電子書籍でもEPUBやPDFで提供されているものが少なからずあるけど、ぼくはこの理由によりAmazon Kindleで買えるものは結構Amazonで買ってしまう。Kindleではデバイスを変えてもちゃんと続きから読めるので。
  • SpotifyのそれはKindleのそれほどシームレスではないが、Amazon MusicAWAに比べるとずっと「さっきまで聴いていた曲(やプレイリスト)」にアクセスしやすい印象がある。

次世代のネットCMを

  • それから、つくづく思うのはこうしたサービスにおけるCMの役割で、上述のようにSpotifyで流されるCMは異例と言えるほど良質だと思うが、それでも「CMをこれ以上聴きたくないなら有料プランにしよう」なんて言ってくる。
  • それって、「こんなCM、不快なだけで聴きたくないよね」と言っているようなものであって、スポンサーに対してはもちろん、それを甘んじて受け入れているユーザーにも失礼である。
  • で、こういうCMに対する姿勢というか使い方はSpotifyに限ったことではなく、むしろ多数派だろう。前にも書いたがこのはてなブログもそうだし。
  • CMが不快になるのは、第一にその商品とユーザーがマッチしていないときであり、第二にその広告自体の品質が粗悪な場合である。
  • 後者の「良質・粗悪」の基準は前者に左右される部分もあるが、いずれにせよそれらの点がクリアされればCMはむしろ面白いし、クリエイティブな文化でもある。
  • 広告をユーザーにマッチさせられない、またはマッチしているかどうかを評価できない状況を作っておきながら、「こんなCM見たくもないですよね、ではお金ください」という世界からはそろそろ卒業したいものだと思う。

*1:と言っても、「こりゃ使えない」と音を上げたのは半年以上前なので、多少は改善されているかもしれないが、料金を払ってまでわざわざ検証する気にもなれない。

*2:もちろん自費で。