ZAPAnet総合情報局 > [Z]ZAPAブロ〜グ2.0 > プログラミングTIPS > 楽天からのツイートで「アマゾン」と入力すると、「わいせつ」と注意される件

楽天からのツイートで「アマゾン」と入力すると、「わいせつ」と注意される件

このエントリーをはてなブックマークに追加
2010年08月25日 カテゴリ:プログラミングTIPS
楽天ブックスのページから、Twitterにつぶやく機能が追加されたことはご存じでしょうか?

楽天ブックスの商品をTwitterですすめる場合、コメントを60文字自由に入力することができます。

その際、楽天ブックスのライバルとも言える「アマゾン」と入力すると、
わいせつ、もしくは公序良俗に反すると判断された表現が含まれています
と表示されてしまいます。



どうしてこうなってしまうのでしょうか?
アマゾンはわいせつですか?


ということで、調べてみました。


まず、楽天ブックス商品ページに移動します。
最近「買い物かごに入れる」ボタンの下辺りに、「つぶやく」ボタンが追加されました。
このボタンをクリックします。



このとき、「Adobe Photoshop Lightroom 3が53%OFFだ、すごい!」などと勘違いしてはいけません。
Lightroom 3の定価は、33,600円です。
定価より25000円以上高い価格を通常価格に設定して、値引率が高いように見せかける楽天マジックですので。

現在8月25日から28日までは、Adobe製品がキャンペーン中のようで、楽天ブックス以外にも、AmazonのAdobe製品キャンペーン品揃え豊富で安い!NTT-X Store でもAdobe製品が安く購入できます。Adobe製品が欲しい人は今がチャンスです。


おっと、話がそれました。
「アマゾン」が「わいせつ」と言われてしまう件ですね。

次に、試しに「アマゾン」の代わりに「Amazon」と入力してみます。
すると、「わいせつ」とは言われません。
ひらがなで「あまぞん」も大丈夫でした。

ということは、「楽天」が「アマゾン」をライバル視して、除外キーワードに設定しているわけではないことがわかります。

「アマゾン」でダメなら、「アマ」や「ゾン」はどうだろうと試してみると、これは通ります。
何がダメだったかというと、「アマゾン」に含まれていた「マゾ」の部分でした。



「アマゾン」という単語単位でとらえないで、「アマゾン」の中の「マゾ」部分だけを見て、「わいせつ」と判断するアルゴリズムになっていました。
「マゾ」がダメならということで、「サド」と入れたりもしてみましたが、こちらは問題ありませんでした。
「ちんこんさい」や「うんこうじょうきょう」はわいせつと判断されました。

楽天ブックスはもう少し頭の良いテキスト解析処理に改良しないといけないと思います。


あと、いろいろ実験したので、楽天でAdobe Photoshop Lightroom 3を注文しておきました。