Chrome HTMLを保存(魚拓)を簡単に出来るArchiveBoxの使い方 日々変化するWebページを保存(魚拓)したいことって結構あると思います。自分もそうで、ちょくちょく変化するWebページを毎日保存して、変化を抽出しようと思い。 昔、PHPでスクレイピングした時にやったことはあるのですが、今回は気軽に... 2020-04-23 Chromedockerブログ
Chrome CentOS7 にnode,npm,puppeteer環境を構築 実際はkusanagi環境ですが。インストールして起動確認までのチェック。 AutoItなどで作成した実行形式は会社によってはシステム管理部署にお伺いを立てるなど面倒なことがあるので、Webサービスを自動操作するならpuppeteerでと思い入れてやってみようと。 2020-04-08 Chromenodejsブログ
WebDriver navigator.webdriver=trueだとロボットだとバレる。その回避法はあるか?puppeteerなら出来そう Selenium含め、WebDriver使うとnavigator.webdriver=trueがセットされます。もし自分のサイトがスクレイピングなどされたくない場合は、JavaScriptなどでこの値がtrueにセットされていれば別ページにジャンプなどすればOK。puppeteerだとnavigator.webdriverプロパティを削除することが出来ます。 2020-03-04 WebDriverブログ