WebからHTMLを取得してパースする

CoffeeScriptの場合

requestとcheerioを使うとできる

<html>
  <body>
    <div id="target"><p>hogehoge</p></div>
  </body>
</html>

のようなHTMLが、example.comにあるとすると、以下のようにCSSセレクタ/jQueryっぽい感じで簡単に取得できる。

url = 'http://example.com/index.html'
request url, (_, res) ->
    $ = cheerio.load res.body
    text = $('#div p').text()
comments powered by Disqus