2023年12月から独学にてプログラミングを勉強し始め、約5ヵ月。
プログラミング習得には、1000時間程度の勉強が必要と言われますが、日常的に使わないから、なかなか覚えられない・・。
実用的なプログラミングとなると、さらに厳しい現状にあります。
頭の整理をしながら、現状を記していきます。
今まで学習した書籍
①高校生からのpython入門:立山秀利(著)
②スッキリわかるPython入門 (スッキリわかる入門シリーズ):国本大悟(著)、須藤秋良(著)
③体験してわかる!会話でまなべる!プログラミングのしくみ1年生第2版図書 スッキリわかるPython入門:森巧尚(著)
④マインクラフトでわくわく学ぶ!Pythonプログラミング入門:株式会社Nuco 梶間悠平(著)
⑤Python2年生 スクレイピングのしくみ 体験してわかる!会話でまなべる!:森巧尚(著)
やってもやっても身にならないのは、なんでぇ~!って感じです。
でも、これからも学習は続けていきたいと思うので、諦めずにやっていこうと思います。
ちなみに今やっていることを復習の意味も込めて、整理します。
ウェブページからデータを取得し、それを解析・利用するプロセスです。
これは、情報収集、データ分析、自動化などの目的で広く使用されています。
スクレイピングの基本
スクレイピングは、HTMLやXMLなどのウェブページのソースコードを解析し、必要な情報を取り出すことで行われます。
必要なツールとライブラリ
スクレイピングを行うためには、適切なツールとライブラリが必要です。
Pythonでは、Beautiful Soupやrequestsなどのライブラリが一般的に使用されます。
今やっている本でもこの2つの外部ライブラリをインストールして学習してます。
これらのツールを使うことで、ウェブページの解析やデータの取得が簡単になります。
スクレイピングの注意点
スクレイピングを行う際には、サイトの利用規約に従うことが重要です。
また、連続して大量のリクエストを送信すると、サーバーに負荷をかけることになります。
そのため、適切なアクセス頻度を設定するか、サーバーへの負荷を最小限に抑える工夫が必要です。
あとは、クローリング禁止の場所にクローリングをしないことらしいです。
プログラミングって難しいですね。