「これはなに?」機能を実装しました。

  • このエントリーをはてなブックマークに追加
  • Pocket
  • LINEで送る

こんにちは!

昨日ラボブログに書いた「これはなに?」機能を実装しました。

 

どこが変わったかというと、BLOGとGoogleのランキングに、トレンドワードの説明がわりとなるニュースの記事へのリンクを付けました。

というのも、トレンドワードは恐らくはほとんどなにかしらのニュースになっているだろうと思いますので、ニュースのタイトルに当該ワードが含まれているものについては、そのワードを説明するものになるだろう、という考えです。

例えば、

Googleトレンドワードランキング

等を見てもらうと、いくつかのワードの下にニュースのタイトルとリンクがあるのが分かると思います。

これが「これはなに?」機能で実装したものです。

ニュースタイトルにヒットしないワードに対しては表示ができていませんが、これでだいぶ分かりやすくなったのかなと思っています。

 

・・・が。ちょっとした問題に遭遇しました。

例えば、5月9日、5月10日のBlogとGoogleのランキングを見ると、”サーティワン”というワードがランクインしています。しかしBlogのほうには説明ニュースがついていますがGoogleのほうにはついていません。

2016年5月9日のgoogleトレンドワードランキング

2016年5月10日のBLOGトレンドワードランキング

よく見ると、BLOGのほうでは「サーティワン」、Googleのほうでは「サーティワン」となっていて、サーティーかサーティか、という延ばし棒あるなしの違いが出ています。

もっと見ると、Googleのランキングでは「31」というワードもランクインしていて、全てサーティワンの100円キャンペーンのことを指していると思われるのです。

サーティワンのサイトを見ると、カタカナ表記では「サーティワン」が正解のようですが、残念ながら「サーティーワン」のほうでしかニュース記事タイトルになっていないようです。

「31」に至っては、全く違う記事がヒットしており、恐らくランキングに上がった理由はそれじゃないだろうという説明になってしまっていますね・・・

 

こういった表記揺れやシノニムには対応できていないのが現状です。

検索エンジンなどは辞書を持っていて、その辺りを吸収しているんじゃないかなと思いますが、その辞書が使えるAPIなんかがどこかにないかなあ・・と探しています。

みなさん、もしご存知だったら是非教えてください!

 

これからもどんどん機能の追加や使い勝手向上を行っていきますよ!

 

それでは。

 

  • このエントリーをはてなブックマークに追加
  • Pocket
  • LINEで送る

SNSでもご購読できます。