SORNEWS - Reuters Spotlight と PHP でニュースのデモ

最終更新日時:2009年11月02日 06:00

Reuters Spotlight(ロイター・スポットライト)とは

拡大 Reuters Spotlightとは、 通信社ロイターが 収集、配信したニュース、記事、写真、動画を取得できるプログラマ向けのサービスです。 ロイターの記事を過去を含めて取得できるため、創意工夫しだいで、ニュース関連の様々なソフトウェアを作れます。 また、日本語を含め、様々な言語に対応しているのが特徴です。

何故、通信社がソフトウェア開発をしているの?

ご存知の方も多いと思いますが、通信社とは、時事情報を取材し提携している新聞社や放送局に配信します。つまりニュースの卸問屋です。 その卸問屋が消費者向けにサービスを提供し始めました。でも、何故に通信社がソフトウェア開発をしているのでしょうか。少し疑問に思ったので 調べてみました。

インターネットの台頭により、速報性のあるニュースをリアルタイムで簡単に確認できる時代になりました。 そうなると、携帯電話やパソコンで手軽にニュースが読めるので、若年層が新聞を購読しなくなりました。  購読者数が減ると、売上も落ち、広告の申し込みも減っていくことになります。

アメリカでは、約150年の歴史を持つ、ロッキーマウンテンニュース紙が廃業になりました。 新聞社は今後も苦しい経営を迫られるようです。次々と配信先の報道機関がなくなっていくと、通信社にも 当然影響がでてきます。そのような将来を見据え、ロイターでは、ロイターラボを設立し 日夜新しいアイデアを研究・開発しています。

通信社や新聞社のインターネットへの取り組み

海外の通信社や新聞社が、インターネットという新しい情報媒体に対してどのような取り組みをしているかを調べていくと、 新しいアイデアを模索している企業がいくつも見受けられます。ロイターに次ぐ世界第3位のフランス通信社(AFP)は、 株式会社クリエイティヴ・リンクと共同で AFP BB NEWS というニュースコミュニティサイトを 運営しています。

AFPBB Newsは、Flash形式でブログで記事を引用できる機能を提供しています。 いままで、通信社は個人に対して一次情報を販売することはありませんでしたが、 広告掲載をする代わりに、一次情報を引用できるようになりました。個人はいち早く ニュースを取得しさらに配信できるメリットがあります。

ブログでは、ブログ間でリンクが張られたりコメント欄を使って、さまざまな議論が交わされます。 つまり、フランス通信社としては広報活動をしなくても、ブログ間で自立して情報が拡大していきます。 そのため、このニュースを引用できる仕組みを、Yahoo!やLivedoor Blogなどのブログ運営会社に 提供するだけで、インターネットでの新たな収入モデルの基盤を確立することができました。

ニューヨーク・タイムズの取り組みはさらに先進的です。2009年2月4日に、1987年から現在までのすべてのニュース記事を無料化し プログラマ向けの記事検索機能を公開しました。(Times Developer Network[英語])

以前、ニューヨーク・タイムズのインターネット版は有料でした。新聞紙と同じ 販売モデルで消費者へ購読してもらう仕組みでした。ですが、距離などの物理的制約がない インターネット上では、無料で記事が読めるサイトを直ぐに見つけることができます。 そのため、このビジネスモデルでは採算を合わせるのは難しかったため直ぐに方向転換しました。

新たなビジネスモデルでは、今までの記事を無料で解放することで、 多くのブログやサイトでニューヨーク・タイムズへの記事へのリンクを作ってもらい、 ニューヨーク・タイムズへのアクセス数を増やす仕組みです。アクセス数が増えれば、 広告を観る機会が増えるため、今後、広告収入の増加が期待できます。

インターネットという新しいメディアに積極的に挑戦して、ブログやニュースサイト での記事の無断転載などの不正利用に対して、模索しながら取り組んでいく事例を紹介しました。 一方で、AP通信(Associated Press)は、2009年10月現在、既存の権利を守るため同社のインターネット上の 情報にはタグを付けて追跡できるシステムを開発しているようです。 (AP通信 プレスリリース[英語]) ライセンス契約をした企業や消費者のみAP通信の記事を転載できるシステムと予想できます。

このように、ロイターをはじめ通信社や新聞社はインターネットと既存の仕組みをどのように融合するか 模索し、さまざまな仕組みを生み出しているのが現状です。日本は海外に比べると、新聞社の規模が大きいです。 また、新聞紙の購読率も高いため、まだアメリカほどインターネット上の研究・開発が行われていませんが、 近い未来、日本でも同じような取り組みが活発になることが予想できます。

サンプルを見て、何ができるのか調べてみましょう

スティングレイ エンジニアリング: ロイター・スポットライト API デモ

スティングレイエンジニアリングが作ったデモです。 ウェブサイトに簡単に組み込める部品として作られています。'Top News','Tech News'という分類(*1)が タブ表示で管理されて、その中に記事のタイトルと詳細が書かれているのがわかります。

*1 ロイター・スポットライトではChannels(チャネルまたはチャンネル)という表現。

このデモでは、表示した時点で最新情報をロイター・スポットライトから取得します。 そのために表示されるまでに待たされる場合があります。

Breaking news map

Google Mapと連動したデモです。ロイター・スポットライトで取得した地域情報を元に、 Goole Mapの座標を割り出して吹き出しの形で表示しています。ニュースは数秒すると切り替わる仕組みです。暫くすると地図が移動し新しいニュースが表示されます。

画面の右側にコントロールがあり、ニュースの一時停止、ニュースのチャンネル切り替え、表示速度の調整ができます。

Bester News

Bester Newsは、2006年からあるRSS(*2)を利用したニュースサイトです。 さまざまなニュース関連の情報を取得して、そのソースを元にニュースサイトを作成しています。 ロイター・スポットライトもRSSに対応しているので利用しています。

(*2)RSSとは、ファイルの形式のことで、最新ニュースをお知らせする場合や、ブログを更新した通知をするためによく利用されます。

スティングレイエンジニアリングのデモでは、 ロイターの記者が投稿して公開されたニュースをほぼリアルタイムで取得しています。Bester Newsでは、過去のニュース記事も リンク切れが発生することなく取得できていました。

すべてのデモを紹介することはできませんが、ロイター・スポットライトの公式サイトには、デモのギャラリーがあります。 動画配信や株価情報の表示などに挑戦したデモがあるので興味がある方は覗いてみてはいかがでしょうか。

Reuters Spotlightの技術的な説明

ロイター・スポットライトでニュース記事などを取得するには、ブラウザからURLを入力するような方式を採用しています。これはAPIフィードなどとよばれ以下のように要求します。

パス・パラメータ形式
http://spotlight.reuters.com/api/feed/[edition]/[content]/[channel]/[format]?apikey=[key]
http://spotlight.reuters.com/api/feed/us/channelarticles/topnews/atom?apikey=[key]

コンテントタイプ

タイプ概要
画像画像を取得できます。
ビデオ動画を取得できます。
ニュース記事情報を取得できます。
記事記事チャンネルでは、ニュース、付属する画像、ビデオ情報、株式シンボルなどがすべて取得できます。上記3つを合わせたチャンネルです。

現在、取得できる方式は上記の4つになります。記事チャンネルは、画像、ビデオ、ニュースのチャンネルをまとめたものです。例えば、パソコンでニュースを見る場合は 画像情報や、株式シンボル情報が表示情報としてあったほうが便利です。ですが携帯電話などでできるだけデータ量を減らしたい場合は、ニュースチャンネルで 記事情報のみを取得するなどの方法ができます。

日本は、携帯電話の通信でも画像や動画があっても問題ありません。ただし国際的には様々な環境が想定されるのでこのようなコンテントタイプがあります。

フィード形式

ロイター・スポットライトにデータを要求した際に、以下の形式でデータの取得が可能です。

形式概要
AtomAtom 1.0 形式
Medis RSSMedia RSS(MRSS)1.1.1形式。動画などのメディア情報のために、拡張されたRSS形式です。日本では、Yahoo! JAPANやニコニコ動画が採用しているようです。
JSONJSON(Javascript Object Notation Format)は、元々はJavascript言語ように開発された形式で、現在は軽量なデータ交換フォーマットとしていろいろな場所で使われています。
RSSRSS 2.0 形式。記事の全文は取得できませんが他のフォーマットにくらべ高速です。
OPMLOutline Processor Markup Language(アウトライン・プロセッサ・マークアップ言語、OPML)。これから普及するかもしれない方式です。
XML単純なXML形式です。
PHPシリアライズされたPHPオブジェクトです。PHPプログラミング言語で簡単に扱える方式です。

API フィードの使い方

フィードは以下2種類あります。

Feed概要
Content Feedsニュース記事、画像、ビデオなどを取得するフィードです。
Infomation Feedsこちらはニュースのメタ情報を取得するフィードです。例えば、ニュースは、経済ニュース、テクノロジニュースなどのカテゴリがあったり、 その記事が、英語なのか、日本語なのか、など、ニュース記事の情報ではなく、属性となる情報があり、このフィードで取得できます。

ここまでで、記事をどのように要求して、どのような形式で結果を取得できるか理解できたと思います。様々な方式があって複雑かもしれませんが 実際には、Feeds | Reuters Spotlightから、セレクトボックスを選択することで、フィードを生成できます。 そのため、後は取得した結果の形式に対してプログラミングをすればよいだけになります。

デモ

縦書きのデモをつくってみて分かったこと

結論から言うと、現実的ではない。

今まで、縦書きや組版について興味がなかったため、ブラウザでも縦書きで読めると便利そうだと安易に考えてました。 メイリオ・フォント用に縦書きでニュースを出力したデモを作ってみたのですが、 ソフトウェアもハードウェアも横書きを前提に作られている事を実感させられました。

ハードウェアでいえばマウスが大きいです。今はスクロールホイール付きのマウスや、 それに進むボタン、戻るボタンが付いたマウスが主流です。普段は意識しないのですが、縦書きの場合、文章は左に増えていくので、ホイールを上下に動かすのに、 画面のスクロールは左右に動くという違和感のある作りになってしまいます。 本の「ページめくり」のような仕組みを作りこめば、ホイールを動かすごとに、ページが捲られる事は可能ですが現実的ではありません。

ソフトウェアでいえば、「縦に揃える」や「情報を検索対象にする」難しさがあります。今回は一番簡単な方法であると思われる、テーブル定義と改行要素(<br>)を使って表示させてみました。 WindowsXPとメイリオ・フォントの組み合わせでは綺麗にそろっています。「縦に揃える」だけで考えるとこの方法で縦書きサイトをつくるのも問題ありません。 しかし、「情報を検索対象にする」という視点でみると、改行要素(<br>)で区切られて、一文字単位で保持される形になるため、本来のデータとしては問題があります。

本来のデータを「情報を検索対象にする」ために別に保持したり、代替案で回避することも可能ですが、プログラミングが必要になります。

現時点では、PDFファイルで出力するか、Adobe Flash の縦書き機能で実装するのが一番現実的な方法なのかもしれません。日本語の処理については以下の書籍などがあるようです。

ケン・ランディ 『CJKV日中韓越情報処理』 Ken Lunde (原著)、小松章 (翻訳)、オライリー・ジャパン、2002年。ISBN 978-4-87311-108-7

NewsML仕様について

NewsML(ニュース用マーク付け言語‎ 、ニューズエムエル)という国際的な 仕様があります。調べていくと元々はロイターが開発をはじめて、IPTCによる国際的な標準規格になったようです。 (参考:newsml)ですが、ロイター・スポットライトとは仕様が異なります。 調べてみたら、同時期にRSSが草の根的に普及し始めたため、現在の軽量な方式を採用する方向に進んだようです。(参考:新聞業界のNewsMLプロジェクトが足踏み)

参考