https://ironsoftware.com/csharp/webscraper/tutorials/webscraping-in-c-sharp/#how-to-create-a-web-form-application
Cách quét dữ liệu từ các trang web trong C #
IronWebscraper là một Thư viện .Net để quét web, trích xuất dữ liệu web và phân tích nội dung web. Đây là một thư viện dễ sử dụng có thể được thêm vào các dự án Microsoft Visual Studio để sử dụng trong phát triển và sản xuất.
IronWebscraper có nhiều tính năng và khả năng độc đáo như kiểm soát các trang, đối tượng, phương tiện được phép và bị cấm, v.v. Nó cũng cho phép quản lý nhiều danh tính, bộ đệm web và nhiều tính năng khác mà chúng tôi sẽ thảo luận trong tài liệu hướng dẫn này.
Khán giả mục tiêu
Hướng dẫn này nhắm đến các nhà phát triển phần mềm có kỹ năng lập trình cơ bản hoặc nâng cao, những người muốn xây dựng và triển khai các giải pháp cho khả năng cạo nâng cao (quét trang web, thu thập và trích xuất dữ liệu trang web, phân tích nội dung trang web, thu thập trang web).
Kỹ năng cần có
Các nguyên tắc cơ bản cơ bản của lập trình với các kỹ năng sử dụng một trong các ngôn ngữ Lập trình Microsoft như C # hoặc VB.NET
Hiểu biết cơ bản về Công nghệ Web (HTML, JavaScript, JQuery, CSS, v.v.) và cách chúng hoạt động
Kiến thức cơ bản về Bộ chọn DOM, XPath, HTML và CSS
Công cụ
Microsoft Visual Studio 2010 trở lên
Tiện ích mở rộng dành cho nhà phát triển web dành cho trình duyệt, chẳng hạn như trình kiểm tra web cho Chrome hoặc Fireorms cho Firefox
Tại sao phải cạo? (Lý do và khái niệm)