Ruby

【Ruby】Open-URIは例外を拾って404をチェックする

以下のコードでは、URLが404 Not Foundのときにエラーになって止まる。 require 'open-uri' url = 'http://example.com' html = open(url) do |f| f.read end URLを開けなかったら例外OpenURI::HTTPErrorを投げてくれるので、ちゃんと捕捉する。 require 'op…

スクレイピングで正規表現の練習

今すぐ始めるスクレイピング nokogiriとかのスクレイピング用ライブラリを使わずに標準ライブラリ'open-uri'だけでスクレイピングをします。HTMLソースを取得するだけならこれで十分。以下のサイトを参考にスクレイピングしたいサイトのHTMLソースをまるごと…