it/Node.js
Puppeteer를 이용한 크롤링(Crawling) - HTML파싱
하얀나다
2020. 3. 9. 00:41
이제 파싱을 해보자.
우선 따라쳐라.
const puppeteer = require("puppeteer");
const main = async () => {
const browser = await puppeteer.launch();
const page = await browser.newPage();
await page.goto(
"https://sports.news.naver.com/kbaseball/record/index.nhn?category=kbo",
{ waitUntil: "networkidle2" }
);
await page.waitFor(5000);
const teamRank = await page.waitFor(
//id는# class는. 다 알잖아요
"tbody#regularTeamRecordList_table>tr:nth-child(1)>td.tm>div>span"
);
const txtTeamRank = await page.evaluate(
teamRank => teamRank.textContent,
teamRank
);
console.log("1등 팀은 : ", txtTeamRank);
await browser.close();
};
main();
이런식으로 파싱 해올수 있다.