ハローエンジニア!SEライターのナガヤンです。
あなたはRSSを利用していますか?RSSはニュースやブログなどの更新情報を配信するためのWeb技術で、サーチバンクでもこのたびRSS配信を始めました!
RSSは、SNSやまとめサイトの普及につれて利用者が減少し、Googleリーダーなど有名なRSSリーダーがサービス終了したこともあり、ニッチな情報配信技術になっています。
しかしながら、RSSは効率的な情報収集技術のひとつであることには変わりなく、古い技術ゆえにノウハウが多く安定しているため、いまでもラジオの聴くように使うことができます。
今回RSS配信するために利用したサービス「feed43」がシンプルに使いやすかったので、紹介させていただきます!
このページの目次
「Feed43」では、RSSを配信していないウェブサイトに対して、RSSフィードを作成することができます。サイトの認証などはないため、サイトの利用者でもRSSフィードを作成できるのが特徴です。
「Feed43」でRSSフィードを作る手順は次のようになります。
まずは、「Feed43」にアクセスします。
このページが表示されたら、「Create your first RSS feed」をクリックしてRSSフィードの作成をはじめます。
次のようなページが表示されたらOKです。
続けて表示された入力欄に、RSSを配信したいWebサイトのURL(Address)を入力します。
右の小さい入力欄には、エンコーデング(Encoding)を指定します。多くの場合は「utf-8」と入力します。もし違っていてもあとで変更できるので、分からなければ「utf-8」としておきましょう。
サーチバンクの設定はこんな感じです↓
最後に「Reload」ボタンをクリックすると、指定したページのソースコードが表示されます。文字化けすることなく表示されていればOKです。
文字化けしていた場合は、エンコーディングを変更することで解決します。日本語のページなら「Shift_JIS」や「EUC-JP」を入力すると解決することが多いでしょう。
これでRSS配信したいページのソースコードが取得できました。ただし、これはページ全体のソースコードです。RSSでは特定の項目のみが欲しい情報になります。
例に挙げているサーチバンクでは,最新記事の情報が欲しい情報になってきます。そのため、必要な部分だけ抽出できるようにルールを決めていきます。
全体のソースコードを見ていくと,特定の繰り返しが見つかるかと思います。この部分が抽出ルールの対象になります。
日付やURL、記事タイトルの部分を{%}で置き換えていき、改行されている部分には{*}を入力します。
サーチバンクでは次のような設定になりました
これを「Item (repeatable) Search Pattern」に入力したら、「Extract」をクリックしましょう。
次のように欲しい情報が抽出できていればOKです。
次に、RSSフィードのフォーマットを決めます。
はじめは、フィード全体のフォーマットを決めます。
タイトルやリンク、RSS配信の説明といった内容です。基本的には最初の設定のままでOKです。
次に実際のRSSフィードの部分(それぞれの記事の部分について)のフォーマットを決めます。こちらには、RSSフィードの記事のタイトルや,そのリンクなどを入力します。
ここで先ほど抽出した情報をそれぞれ{%1}や{%2}のようにパラメータとして取得できます。それを実際のRSSフィードでどのようにアウトプットするかを決めていきます。
サーチバンクのRSSでは次のように設定してみました
これでRSSフィードのフォーマットを決めることができました!
最後にRSSフィードのリンクを取得します。次のような画面が表示されますので、そのURLを任意のリーダーで読んで確認してみましょう。
いま使っているRSSリーダーがない方は、feedlyやSlackで確認できるので試してみてください!
以上で終了です。お疲れ様でした!
今回はRSSフィードを配信していないウェブサイトに対して、「Feed43」を利用することで独自のRSSフィードを生成する方法を紹介しました。
RSSを設置していないサイトが増えてきていますが、「Feed43」なら利用者でもRSSフィードを作成できるので、RSSを活用するなら強力なサービスです。ぜひ使ってみてください!
サーチバンクではマシュマロを設置しています。
ライターに聞いてみたい疑問や質問を募集中です。
記事の感想やご意見なども、よかったらお聞かせください。
⇒https://marshmallow-qa.com/search_bank