通勤ドットコム[自動収集設定作成テクニック(3)
RSSから記事を集めよう!
リンクする中身を取得したい場合には、自動収集設定を書く必要があります。今回は、そのRSSから取得する方法を説明します。
1)Yahoo RSS
Yahoo!ニュースで配信されるRSSは以下のURLにあります。■http://headlines.yahoo.co.jp/rss/
事例(1) Yahoo!ニュース Record China
name = Yahoo!ニュース - 中国
url = http://headlines.yahoo.co.jp/rss/rcdc_cn.xml
urltype=1
link_serach = 10
firstword = <!---記事-->
lastword = <!---/記事-->
deleteword=[続きを読む]
deleteword=CrLf
url = http://headlines.yahoo.co.jp/rss/rcdc_cn.xml
urltype=1
link_serach = 10
firstword = <!---記事-->
lastword = <!---/記事-->
deleteword=[続きを読む]
deleteword=CrLf
url = http://headlines.yahoo.co.jp/rss/rcdc_cn.xml
urltype=1
にポイントがあります。
RSSから収集したい場合にはurltype=1を設定します。そして、URLはRSSを提供しているアドレスになります。
RSSで提供されているアドレスをRSS一覧から正確に記述できれば、比較的簡単に設定できます。
2)アサヒ・コム
朝日新聞が提供するasahi.com速報ニュースのRSSです。■http://www.asahi.com/information/service/rss.html
従来公開していた設定と比べると urlとurltypeが違います。
事例(2) asahi.com/アサヒ・コム
name = asahi.com/アサヒ・コム
url = http://www3.asahi.com/rss/index.rdf
urltype=1
firstword = <h1 id="cap">
firstword = asahi.comトップ
lastword = <div class="sec">
lastword = PR情報
lastword = この記事の関連情報
lastword = おくやみ
deleteword = CrLf
url = http://www3.asahi.com/rss/index.rdf
urltype=1
firstword = <h1 id="cap">
firstword = asahi.comトップ
lastword = <div class="sec">
lastword = PR情報
lastword = この記事の関連情報
lastword = おくやみ
deleteword = CrLf
3)毎日jp-ニュース速報(総合)
毎日新聞の提供する毎日jpのRSSです。対象は「ニュース速報(総合)」です■http://www.asahi.com/information/service/rss.html
事例(3) 毎日jp-ニュース速報(総合)
name = 毎日jp-ニュース速報(総合)
url = http://mainichi.jp/rss/etc/flash.rss
urltype=1
firstword = <div class="NewsArticle">
lastword = <!-- ||ここまで記事ー|| -->
url = http://mainichi.jp/rss/etc/flash.rss
urltype=1
firstword = <div class="NewsArticle">
lastword = <!-- ||ここまで記事ー|| -->
4)ロイター
ローターの提供するRSSです。トップニュース、ビジネス、ワールド、エンタテインメント、テクノロジーなどに分かれて配信されています。英語版もあります。■http://today.reuters.co.jp/rss/newsrss.aspx
事例(4) Reuters: トップニュース
name = Reuters: トップニュース
url = http://feeds.reuters.com/reuters/JPTopNews/
urltype=1
firstword =<span id="midArticle_start">
lastword =<div class="NONE" style="margin-bottom: 0px;">
url = http://feeds.reuters.com/reuters/JPTopNews/
urltype=1
firstword =<span id="midArticle_start">
lastword =<div class="NONE" style="margin-bottom: 0px;">
5)日刊スポーツ
野球、サッカー、バトル、競馬などジャンルに分かれて配信されています。■http://www.nikkansports.com/information/rss.html
事例(5) nikkansports.com-野球
name = 野球 - nikkansports.com
url = http://www.nikkansports.com/baseball/index.rdf
urltype=1
firstword = <!-- +++++ ニュース本文エリア +++++ -->
lastword = <!-- +++++ エヌスクへのトラックバック +++++ -->
url = http://www.nikkansports.com/baseball/index.rdf
urltype=1
firstword = <!-- +++++ ニュース本文エリア +++++ -->
lastword = <!-- +++++ エヌスクへのトラックバック +++++ -->
6)イザ!ニュース
サンケイグループのニュース+ブログのサイトですが、RSSが豊富で多岐に渡っています。今1番お勧めです!■http://www.iza.ne.jp/rss/index.html
事例(6) イザ!ニュース 事件です
name = イザ!ニュース 事件です
url = http://www.iza.ne.jp/news/event/NwCateRSS.rdf
urltype=1
firstword =<p id="izanews_content" class="main_parts type1">
firstword =<div id="contents">
lastword =▼関連記事
lastword =記事タイトルまで戻る
lastword =<h2>
deleteword=記事タイトルまで戻る
deleteword=▼関連記事
url = http://www.iza.ne.jp/news/event/NwCateRSS.rdf
urltype=1
firstword =<p id="izanews_content" class="main_parts type1">
firstword =<div id="contents">
lastword =▼関連記事
lastword =記事タイトルまで戻る
lastword =<h2>
deleteword=記事タイトルまで戻る
deleteword=▼関連記事
7)その他参考RSS配信ページ
※(2007/11/14 改定・修正しました)



