Search

'it/Node.js'에 해당되는 글 6건

  1. 2020.03.09 Puppeteer를 이용한 크롤링(Crawling) - HTML파싱

Puppeteer를 이용한 크롤링(Crawling) - HTML파싱

it/Node.js 2020. 3. 9. 00:41 Posted by 하얀나다

이제 파싱을 해보자.

 

우선 따라쳐라.

 

const puppeteer = require("puppeteer");

const main = async () => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.goto(
    "https://sports.news.naver.com/kbaseball/record/index.nhn?category=kbo",
    { waitUntil: "networkidle2" }
  );
  await page.waitFor(5000);

  const teamRank = await page.waitFor(
  //id는# class는. 다 알잖아요
    "tbody#regularTeamRecordList_table>tr:nth-child(1)>td.tm>div>span"
  );
  const txtTeamRank = await page.evaluate(
    teamRank => teamRank.textContent,
    teamRank
  );

  console.log("1등 팀은 : ", txtTeamRank);

  await browser.close();
};
main();

 

이런식으로 파싱 해올수 있다.