{"id":1190,"date":"2023-02-23T23:16:39","date_gmt":"2023-02-23T16:16:39","guid":{"rendered":"https:\/\/www.jogjahost.co.id\/blog\/?p=1190"},"modified":"2023-02-23T23:16:39","modified_gmt":"2023-02-23T16:16:39","slug":"apa-itu-web-scraping","status":"publish","type":"post","link":"https:\/\/www.jogjahost.co.id\/blog\/apa-itu-web-scraping\/","title":{"rendered":"Apa itu Web Scraping? Cara Kerja, Teknik &#038; Kegunaannya"},"content":{"rendered":"\n\n<div class=\"kk-star-ratings kksr-auto kksr-align-left kksr-valign-top\"\n    data-payload='{&quot;align&quot;:&quot;left&quot;,&quot;id&quot;:&quot;1190&quot;,&quot;slug&quot;:&quot;default&quot;,&quot;valign&quot;:&quot;top&quot;,&quot;ignore&quot;:&quot;&quot;,&quot;reference&quot;:&quot;auto&quot;,&quot;class&quot;:&quot;&quot;,&quot;count&quot;:&quot;10&quot;,&quot;legendonly&quot;:&quot;&quot;,&quot;readonly&quot;:&quot;&quot;,&quot;score&quot;:&quot;2.8&quot;,&quot;starsonly&quot;:&quot;&quot;,&quot;best&quot;:&quot;5&quot;,&quot;gap&quot;:&quot;4&quot;,&quot;greet&quot;:&quot;&quot;,&quot;legend&quot;:&quot;2.8\\\/5 - (10 votes)&quot;,&quot;size&quot;:&quot;24&quot;,&quot;title&quot;:&quot;Apa itu Web Scraping? Cara Kerja, Teknik \\u0026amp; Kegunaannya&quot;,&quot;width&quot;:&quot;76.4&quot;,&quot;_legend&quot;:&quot;{score}\\\/{best} - ({count} {votes})&quot;,&quot;font_factor&quot;:&quot;1.25&quot;}'>\n            \n<div class=\"kksr-stars\">\n    \n<div class=\"kksr-stars-inactive\">\n            <div class=\"kksr-star\" data-star=\"1\" style=\"padding-right: 4px\">\n            \n\n<div class=\"kksr-icon\" style=\"width: 24px; height: 24px;\"><\/div>\n        <\/div>\n            <div class=\"kksr-star\" data-star=\"2\" style=\"padding-right: 4px\">\n            \n\n<div class=\"kksr-icon\" style=\"width: 24px; height: 24px;\"><\/div>\n        <\/div>\n            <div class=\"kksr-star\" data-star=\"3\" style=\"padding-right: 4px\">\n            \n\n<div class=\"kksr-icon\" style=\"width: 24px; height: 24px;\"><\/div>\n        <\/div>\n            <div class=\"kksr-star\" data-star=\"4\" style=\"padding-right: 4px\">\n            \n\n<div class=\"kksr-icon\" style=\"width: 24px; height: 24px;\"><\/div>\n        <\/div>\n            <div class=\"kksr-star\" data-star=\"5\" style=\"padding-right: 4px\">\n            \n\n<div class=\"kksr-icon\" style=\"width: 24px; height: 24px;\"><\/div>\n        <\/div>\n    <\/div>\n    \n<div class=\"kksr-stars-active\" style=\"width: 76.4px;\">\n            <div class=\"kksr-star\" style=\"padding-right: 4px\">\n            \n\n<div class=\"kksr-icon\" style=\"width: 24px; height: 24px;\"><\/div>\n        <\/div>\n            <div class=\"kksr-star\" style=\"padding-right: 4px\">\n            \n\n<div class=\"kksr-icon\" style=\"width: 24px; height: 24px;\"><\/div>\n        <\/div>\n            <div class=\"kksr-star\" style=\"padding-right: 4px\">\n            \n\n<div class=\"kksr-icon\" style=\"width: 24px; height: 24px;\"><\/div>\n        <\/div>\n            <div class=\"kksr-star\" style=\"padding-right: 4px\">\n            \n\n<div class=\"kksr-icon\" style=\"width: 24px; height: 24px;\"><\/div>\n        <\/div>\n            <div class=\"kksr-star\" style=\"padding-right: 4px\">\n            \n\n<div class=\"kksr-icon\" style=\"width: 24px; height: 24px;\"><\/div>\n        <\/div>\n    <\/div>\n<\/div>\n                \n\n<div class=\"kksr-legend\" style=\"font-size: 19.2px;\">\n            2.8\/5 - (10 votes)    <\/div>\n    <\/div>\n\n<h2 class=\"wp-block-heading\">Apa itu <em>Web Scraping<\/em>?<\/h2>\n\n\n\n<p><em>Web scraping<\/em> adalah suatu metode untuk mengekstraksi data spesifik dari suatu web. Data yang sudah terekstraksi bisa Anda kumpulkan di Google Sheets atau Microsoft Excel&nbsp;<\/p>\n\n\n\n<p>Meski bisa melakukannya secara manual, kebanyakan orang melakukannya menggunakan <em>tools<\/em> yang bisa bekerja secara otomatis. Jadi, skala data yang bisa Anda ekstraksi akan jauh lebih besar.<\/p>\n\n\n\n<p>Jika Anda belum memiliki gambaran tentang hal ini, kami akan memberikan sedikit contoh <em>web scraping<\/em>.<\/p>\n\n\n\n<p>Misalnya, Anda mengekstrak <em>list<\/em> harga produk laptop di Shopee. Berdasarkan data tersebut, Anda bisa menetapkan <em>positioning<\/em> dan harga yang tepat saat menjual laptop di <a href=\"https:\/\/www.jogjahost.co.id\/blog\/marketplace-adalah\/\" target=\"_blank\" rel=\"noreferrer noopener\"><em>marketplace<\/em><\/a>.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><em>Web Scraping<\/em> Vs <em>Web Crawling<\/em><\/h2>\n\n\n\n<div class=\"wp-block-image\"><figure class=\"aligncenter size-large\"><img fetchpriority=\"high\" decoding=\"async\" width=\"1024\" height=\"432\" src=\"https:\/\/www.jogjahost.co.id\/blog\/wp-content\/uploads\/2021\/03\/image-34-1024x432.png\" alt=\"apa itu web scraping\" class=\"wp-image-1191\" srcset=\"https:\/\/www.jogjahost.co.id\/blog\/wp-content\/uploads\/2021\/03\/image-34-1024x432.png 1024w, https:\/\/www.jogjahost.co.id\/blog\/wp-content\/uploads\/2021\/03\/image-34-300x127.png 300w, https:\/\/www.jogjahost.co.id\/blog\/wp-content\/uploads\/2021\/03\/image-34-768x324.png 768w, https:\/\/www.jogjahost.co.id\/blog\/wp-content\/uploads\/2021\/03\/image-34-1536x648.png 1536w, https:\/\/www.jogjahost.co.id\/blog\/wp-content\/uploads\/2021\/03\/image-34.png 1600w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption>Sumber: parsehub.com<\/figcaption><\/figure><\/div>\n\n\n\n<p>Banyak orang yang masih bingung dengan perbedaan <em>scraping<\/em> dan <em>crawling<\/em>. Pasalnya kedua hal ini tampak serupa, meski pada prinsipnya berbeda.<\/p>\n\n\n\n<p><em>Web crawling<\/em> adalah proses <em>indexing<\/em> ke seluruh web di jaringan internet. Artinya, <em>bot\/crawler<\/em> akan menelusuri atau merayapi seluruh <em>website<\/em> atau <em>web page<\/em> yang ada.<\/p>\n\n\n\n<p>Maka dari itu, program tersebut berkaitan erat dengan fungsionalitas mesin pencari.<\/p>\n\n\n\n<p>Sedangkan <em>data scraping<\/em> artinya mengekstraksi data tertentu dari berbagai web. Dengan kata lain, halaman web dan data yang jadi target lebih spesifik.&nbsp;<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Cara Kerja <em>Web Scraping<\/em><\/h2>\n\n\n\n<div class=\"wp-block-image\"><figure class=\"aligncenter size-full\"><img decoding=\"async\" width=\"1600\" height=\"800\" src=\"https:\/\/www.jogjahost.co.id\/blog\/wp-content\/uploads\/2021\/03\/image-35.png\" alt=\"apa itu web scraping\" class=\"wp-image-1192\" srcset=\"https:\/\/www.jogjahost.co.id\/blog\/wp-content\/uploads\/2021\/03\/image-35.png 1600w, https:\/\/www.jogjahost.co.id\/blog\/wp-content\/uploads\/2021\/03\/image-35-300x150.png 300w, https:\/\/www.jogjahost.co.id\/blog\/wp-content\/uploads\/2021\/03\/image-35-1024x512.png 1024w, https:\/\/www.jogjahost.co.id\/blog\/wp-content\/uploads\/2021\/03\/image-35-768x384.png 768w, https:\/\/www.jogjahost.co.id\/blog\/wp-content\/uploads\/2021\/03\/image-35-1536x768.png 1536w\" sizes=\"(max-width: 1600px) 100vw, 1600px\" \/><figcaption>Sumber: hirinfotech.com&nbsp;<\/figcaption><\/figure><\/div>\n\n\n\n<p>Kami akan coba menjelaskan cara kerja program ini sesederhana mungkin.\u00a0<\/p>\n\n\n\n<p>Pertama-tama, Anda sebagai <em>user<\/em> harus memberikan referensi URL (satu atau lebih) ke <em>scraper tool<\/em>.<\/p>\n\n\n\n<p><em>Scraper<\/em> akan memuat semua kode HTML dari halaman yang jadi referensi. <em>Tools<\/em> yang lebih canggih bisa me-<em>render<\/em> semua elemen web seperti CSS dan Javascript.<\/p>\n\n\n\n<p>Idealnya, Anda akan memilih data spesifik untuk di ekstraksi.&nbsp;<\/p>\n\n\n\n<p>Misalnya, Anda melakukan <em>scraping<\/em> pada halaman produk Shopee. Anda hanya memilih data harga dan model, jadi data itu saja yang nanti akan terekstraksi. Data lain seperti spesifikasi produk dan ulasan pelanggan akan diabaikan.<\/p>\n\n\n\n<p>Setelah itu, <em>scraper<\/em> akan mengekstrak semua data tersebut dalam format CSV atau <em>file spreadsheet<\/em>. <em>Scraper<\/em> yang cukup canggih bisa mengekstrak data ke format JSON. Format tersebut nantinya bisa untuk API.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Teknik-teknik <em>Web Scraping<\/em><\/h2>\n\n\n\n<p>Berikut ini adalah teknik-teknik yang bisa Anda aplikasikan untuk melakukan web scraping.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">1. Parsing HTML<\/h3>\n\n\n\n<p>Teknik ini bisa Anda gunakan untuk \u201cmengikis\u201d halaman web statis maupun dinamis. Anda bisa menggunakan metode ini untuk mengekstraksi teks, <em>link<\/em>, <em>screen scraping<\/em>, dll.<\/p>\n\n\n\n<p>Prinsipnya adalah dengan mengirim HTTP Request ke <a href=\"https:\/\/www.jogjahost.co.id\/blog\/komputer-server\/\" target=\"_blank\" rel=\"noreferrer noopener\">server web<\/a>.<\/p>\n\n\n\n<p>Metode ini cukup andal untuk mengekstraksi data dalam jumlah besar dengan waktu relatif singkat.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">2. DOM Parsing<\/h3>\n\n\n\n<p>DOM atau Document Object Model mendefinisikan <em>style<\/em>, struktur, dan konten suatu file XML.<\/p>\n\n\n\n<p><em>Scraper<\/em> bisa menguraikan DOM dan mendapatkan gambaran mendalam tentang struktur suatu web. <em>Scraper<\/em> akan mencari node yang menampung informasi kemudian mengekstrak semua datanya menggunakan XPath.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">3. XPath<\/h3>\n\n\n\n<p>XML Path Language atau XPath merupakan suatu bahasa kueri yang bekerja di dokumen XML.<\/p>\n\n\n\n<p>Sejak XML menggunakan struktur seperti pohon, XPath bisa menavigasi ke seluruh pohon. XPath akan memilih tiap-tiap node berdasarkan parameter tertentu.<\/p>\n\n\n\n<p>XPath bisa Anda kolaborasikan dengan metode DOM Parsing.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">4. Regular Expression<\/h3>\n\n\n\n<p>Metode ini beroperasi mencocokkan <em>file<\/em> tertentu melibatkan bahasa pemrograman seperti Perl atau Phyton.<\/p>\n\n\n\n<p>Cara <em>scraping<\/em> web dengan Python cukup kompleks untuk pemula. Pasalnya Anda harus menguasai Phyton terlebih dahulu.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">5. Google Sheets<\/h3>\n\n\n\n<p>Aplikasi Google Sheets ternyata juga bisa Anda manfaatkan untuk melakukan ekstraksi data.<\/p>\n\n\n\n<p>Daripada metode lain di atas, cara ini relatif lebih mudah bagi pemula.&nbsp;<\/p>\n\n\n\n<p>Caranya relatif mudah. Anda hanya perlu membuka panel Inspect (click kanan -&gt; Inspect) dari suatu halaman web. Kemudian, cari XPath Expression dari elemen yang ingin Anda salin.<\/p>\n\n\n\n<p>Setelah itu, rumus fungsi <strong>=IMPORTXML(\u201cURL\u201d, \u2018XPATH expression\u2019)<\/strong>&nbsp;&nbsp;<\/p>\n\n\n\n<p>Semua data bisa terekstraksi di aplikasi Google Sheet milik Anda.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">6. Menggunakan <em>Web Scraping Tools<\/em><\/h3>\n\n\n\n<p>Metode-metode di atas membutuhkan pengetahuan teknis tertentu untuk bisa menjalankannya.&nbsp;<\/p>\n\n\n\n<p>Para pemula biasanya lebih memilih jalan pintas yaitu dengan menggunakan <em>software<\/em> atau <em>tools scraping online<\/em>.<\/p>\n\n\n\n<p>Anda bisa dengan mudah menemukan <em>tools<\/em> semacam ini. Beberapa <em>tools<\/em> yang cukup andal yaitu: <a href=\"https:\/\/www.import.io\/\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Import.io<\/a>, <a href=\"https:\/\/www.octoparse.com\/\" target=\"_blank\" rel=\"noreferrer noopener\">Octoparse<\/a>, <a href=\"https:\/\/www.parsehub.com\/\" target=\"_blank\" rel=\"noreferrer noopener\">ParseHub<\/a>, dll.<\/p>\n\n\n\n<p>Anda juga bisa menggunakan <em>browser<\/em> Chrome untuk melakukan <em>scraping<\/em>. Cara menggunakan <em>web scraper<\/em> Chrome sangat mudah. Anda hanya perlu menginstal Add On seperti Web Scraper oleh Webscraper.io, Data Scraper oleh Data-Miner.io, Scraper oleh DVHTN, dll.<\/p>\n\n\n\n<p>Teknik-teknik di atas memang bisa Anda gunakan untuk melakukan <em>scraping<\/em>. Tapi sayangnya, tidak semua teknik bisa bekerja 100% secara efektif.<\/p>\n\n\n\n<p>Terkadang Anda akan mendapati sejumlah tantangan. Beberapa web akan sulit Anda ekstraksi. Beberapa lainnya mungkin akan memblokir IP Anda.&nbsp;<\/p>\n\n\n\n<p>Meski berhasil melakukan ekstraksi data, Anda juga harus siap dengan data yang berantakan.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Manfaat <em>Web Scraping<\/em><\/h2>\n\n\n\n<div class=\"wp-block-image\"><figure class=\"aligncenter size-full\"><img decoding=\"async\" width=\"1024\" height=\"512\" src=\"https:\/\/www.jogjahost.co.id\/blog\/wp-content\/uploads\/2021\/03\/image-36.png\" alt=\"apa itu web scraping\" class=\"wp-image-1193\" srcset=\"https:\/\/www.jogjahost.co.id\/blog\/wp-content\/uploads\/2021\/03\/image-36.png 1024w, https:\/\/www.jogjahost.co.id\/blog\/wp-content\/uploads\/2021\/03\/image-36-300x150.png 300w, https:\/\/www.jogjahost.co.id\/blog\/wp-content\/uploads\/2021\/03\/image-36-768x384.png 768w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption>Sumber: towardsdatascience.com\u00a0<\/figcaption><\/figure><\/div>\n\n\n\n<p>Fungsi <em>web scraping<\/em> secara umum adalah untuk mengekstraksi data dari suatu sumber spesifik. Hal tersebut bisa Anda manfaatkan untuk kepentingan bisnis Anda, misalnya:<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">1. Price Intelligence<\/h3>\n\n\n\n<p><a href=\"https:\/\/www.zyte.com\/\" target=\"_blank\" rel=\"noreferrer noopener\">Zyte.com<\/a>, penyedia layanan ekstraksi data web, menyatakan bahwa <em>price intelligence<\/em> menjadi penggunaan terbanyak dari <em>web scraping<\/em>.<\/p>\n\n\n\n<p><em>Price intelligence<\/em> artinya mengekstrak informasi produk dan harga dari <em>marketplace<\/em>, kemudian menjadikan data tersebut sebagai \u201cpengetahuan\u201d untuk menunjang bisnis Anda.<\/p>\n\n\n\n<p>Data harga ini bisa Anda manfaatkan untuk:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>Menetapkan Dynamic Pricing.<\/li><li>Mengoptimasi <em>revenue<\/em>.<\/li><li><em>Monitoring<\/em> penetapan harga milik kompetitor.<\/li><li><em>Monitoring<\/em> tren produk.<\/li><li>dll.<\/li><\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">2. Market Research<\/h3>\n\n\n\n<p>Untuk melakukan riset pasar, Anda butuh informasi yang akurat. Nah, <em>scraping<\/em> bisa membantu Anda mendapatkan informasi tersebut.<\/p>\n\n\n\n<p>Anda bisa menargetkan web yang berkualitas, <em>insightful<\/em> dan memiliki <em>visitor<\/em> tinggi.\u00a0<\/p>\n\n\n\n<p>Data dari web semacam itu akan meningkatkan kualitas <em>market research<\/em> yang Anda kerjakan.\u00a0<\/p>\n\n\n\n<p>Metode ini juga menunjang perkembangan bisnis yang lebih cerdas (<em>business intelligence<\/em>).<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">3. Lead Generating<\/h3>\n\n\n\n<p>Hubspot pernah membuat laporan di tahun 2020 bahwa 61% <em>marketer<\/em> menyatakan bahwa meng-<em>generate lead<\/em>\/prospek dan <em>traffic<\/em> menjadi tantangan utama.<\/p>\n\n\n\n<p>Dengan metode ini, Anda bisa mendapatkan daftar prospek atau <em>lead<\/em> yang terstruktur. Datanya bisa berupa identitas, alamat email atau kontak lainnya.<\/p>\n\n\n\n<p>Tapi sebelumnya Anda wajib membuat <a href=\"https:\/\/www.jogjahost.co.id\/blog\/apa-itu-buyer-persona\/\" target=\"_blank\" rel=\"noreferrer noopener\">persona<\/a> yang jadi target bisnis Anda. Dengan demikian, <em>lead<\/em> yang Anda dapatkan benar-benar sesuai.\u00a0<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">4. Brand Monitoring<\/h3>\n\n\n\n<p>Reputasi Anda di internet sangat penting untuk memuluskan perjalanan bisnis Anda.<\/p>\n\n\n\n<p>Anda bisa memantau <a href=\"https:\/\/www.jogjahost.co.id\/blog\/apa-itu-brand-equity\/\" target=\"_blank\" rel=\"noreferrer noopener\">reputasi <em>brand<\/em><\/a> Anda di internet menggunakan metode ekstraksi data web.\u00a0<\/p>\n\n\n\n<p>Dari situ Anda bisa mendapatkan informasi misalnya kesan pelanggan terhadap produk Anda, hal yang jadi keluhan pelanggan terhadap bisnis Anda, pendapat pelanggan tentang penetapan harga, dan informasi bermanfaat lainnya.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">5. Equity Research<\/h3>\n\n\n\n<p>Riset ekuitas untuk investasi saham jadi lebih mudah dengan adanya ekstraksi data web. Anda bisa lebih mudah mengumpulkan setiap item berita dan titik data lain untuk mengidentifikasi saham yang tepat serta <em>trend<\/em> yang saat ini terjadi.<\/p>\n\n\n\n<p>Lima manfaat di atas tentu saja hanya sebagian dari berbagai manfaat lainnya.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><em>Web Scraping<\/em>: Metode Pengumpulan Data untuk Banyak Keperluan<\/h2>\n\n\n\n<p><em>Web scraping<\/em> merupakan salah satu metode pengumpulan data dengan mengekstraksi data spesifik dari halaman web tertentu.<\/p>\n\n\n\n<p>Semua ekstraksi data yang berhasil terkumpul biasanya akan diletakan di aplikasi <em>spreadsheet<\/em> seperti Google Sheet atau Ms. Excel.<\/p>\n\n\n\n<p>Metode ini bisa Anda lakukan secara otomatis dengan berbagai <em>tools<\/em>. Jika ingin data yang lebih akurat, Anda bisa menggunakan program dari Phyton atau menerapkan teknik-teknik lain.<\/p>\n\n\n\n<p>Apabila Anda ingin lebih <em>simple<\/em>, Anda bisa mempercayakan tugas tersebut kepada ahlinya.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Apa itu Web Scraping? Web scraping adalah suatu metode untuk mengekstraksi data spesifik dari suatu web. Data yang sudah terekstraksi bisa Anda kumpulkan di Google Sheets atau Microsoft Excel&nbsp; Meski bisa melakukannya secara manual, kebanyakan orang melakukannya menggunakan tools yang bisa bekerja secara otomatis. Jadi, skala data yang bisa Anda ekstraksi akan jauh lebih besar. &#8230; <a title=\"Apa itu Web Scraping? Cara Kerja, Teknik &#038; Kegunaannya\" class=\"read-more\" href=\"https:\/\/www.jogjahost.co.id\/blog\/apa-itu-web-scraping\/\" aria-label=\"Read more about Apa itu Web Scraping? Cara Kerja, Teknik &#038; Kegunaannya\">Read more<\/a><\/p>\n","protected":false},"author":2,"featured_media":1321,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[243],"tags":[],"class_list":["post-1190","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-serba-serbi"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.3 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Apa itu Web Scraping? Cara Kerja, Teknik &amp; Kegunaannya<\/title>\n<meta name=\"description\" content=\"Apa itu web scraping? web scraping adalah metode pengumpulan data dengan mengekstraksi data-data spesifik pada sejumlah halaman web.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/www.jogjahost.co.id\/blog\/apa-itu-web-scraping\/\" \/>\n<meta property=\"og:locale\" content=\"en_US\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Apa itu Web Scraping? Cara Kerja, Teknik &amp; Kegunaannya\" \/>\n<meta property=\"og:description\" content=\"Apa itu web scraping? web scraping adalah metode pengumpulan data dengan mengekstraksi data-data spesifik pada sejumlah halaman web.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/www.jogjahost.co.id\/blog\/apa-itu-web-scraping\/\" \/>\n<meta property=\"og:site_name\" content=\"Jogjahost Blog\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/hostingindonesia\" \/>\n<meta property=\"article:published_time\" content=\"2023-02-23T16:16:39+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/www.jogjahost.co.id\/blog\/wp-content\/uploads\/2021\/03\/Apa-itu-Web-Scraping.png\" \/>\n\t<meta property=\"og:image:width\" content=\"800\" \/>\n\t<meta property=\"og:image:height\" content=\"400\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/png\" \/>\n<meta name=\"author\" content=\"Jho\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data1\" content=\"Jho\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. reading time\" \/>\n\t<meta name=\"twitter:data2\" content=\"6 minutes\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/apa-itu-web-scraping\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/apa-itu-web-scraping\\\/\"},\"author\":{\"name\":\"Jho\",\"@id\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/#\\\/schema\\\/person\\\/f7c992b57236db3af7c9b4981c748892\"},\"headline\":\"Apa itu Web Scraping? Cara Kerja, Teknik &#038; Kegunaannya\",\"datePublished\":\"2023-02-23T16:16:39+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/apa-itu-web-scraping\\\/\"},\"wordCount\":1099,\"commentCount\":0,\"publisher\":{\"@id\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/#organization\"},\"image\":{\"@id\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/apa-itu-web-scraping\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/wp-content\\\/uploads\\\/2021\\\/03\\\/Apa-itu-Web-Scraping.png\",\"articleSection\":[\"Serba Serbi\"],\"inLanguage\":\"en-US\",\"potentialAction\":[{\"@type\":\"CommentAction\",\"name\":\"Comment\",\"target\":[\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/apa-itu-web-scraping\\\/#respond\"]}]},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/apa-itu-web-scraping\\\/\",\"url\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/apa-itu-web-scraping\\\/\",\"name\":\"Apa itu Web Scraping? Cara Kerja, Teknik & Kegunaannya\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/apa-itu-web-scraping\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/apa-itu-web-scraping\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/wp-content\\\/uploads\\\/2021\\\/03\\\/Apa-itu-Web-Scraping.png\",\"datePublished\":\"2023-02-23T16:16:39+00:00\",\"description\":\"Apa itu web scraping? web scraping adalah metode pengumpulan data dengan mengekstraksi data-data spesifik pada sejumlah halaman web.\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/apa-itu-web-scraping\\\/#breadcrumb\"},\"inLanguage\":\"en-US\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/apa-itu-web-scraping\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"en-US\",\"@id\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/apa-itu-web-scraping\\\/#primaryimage\",\"url\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/wp-content\\\/uploads\\\/2021\\\/03\\\/Apa-itu-Web-Scraping.png\",\"contentUrl\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/wp-content\\\/uploads\\\/2021\\\/03\\\/Apa-itu-Web-Scraping.png\",\"width\":800,\"height\":400,\"caption\":\"Apa itu Web Scraping\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/apa-itu-web-scraping\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Beranda\",\"item\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Serba Serbi\",\"item\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/category\\\/serba-serbi\\\/\"},{\"@type\":\"ListItem\",\"position\":3,\"name\":\"Apa itu Web Scraping? Cara Kerja, Teknik &#038; Kegunaannya\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/#website\",\"url\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/\",\"name\":\"Jogjahost Blog\",\"description\":\"Official\",\"publisher\":{\"@id\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"en-US\"},{\"@type\":\"Organization\",\"@id\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/#organization\",\"name\":\"Jogjahost\",\"url\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"en-US\",\"@id\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/#\\\/schema\\\/logo\\\/image\\\/\",\"url\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/wp-content\\\/uploads\\\/2020\\\/11\\\/Jogjahost-Logo.png\",\"contentUrl\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/wp-content\\\/uploads\\\/2020\\\/11\\\/Jogjahost-Logo.png\",\"width\":200,\"height\":63,\"caption\":\"Jogjahost\"},\"image\":{\"@id\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/#\\\/schema\\\/logo\\\/image\\\/\"},\"sameAs\":[\"https:\\\/\\\/www.facebook.com\\\/hostingindonesia\",\"https:\\\/\\\/www.linkedin.com\\\/in\\\/ptjogjahost\\\/\",\"https:\\\/\\\/www.youtube.com\\\/channel\\\/UCNjzg7FZMoDlHQRvztXTZQA\\\/featured\"]},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/#\\\/schema\\\/person\\\/f7c992b57236db3af7c9b4981c748892\",\"name\":\"Jho\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"en-US\",\"@id\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/1a940f9df7d6eb39176ff487c642337071de767315e1b2ceed9d358ddd0d5207?s=96&d=blank&r=g\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/1a940f9df7d6eb39176ff487c642337071de767315e1b2ceed9d358ddd0d5207?s=96&d=blank&r=g\",\"contentUrl\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/1a940f9df7d6eb39176ff487c642337071de767315e1b2ceed9d358ddd0d5207?s=96&d=blank&r=g\",\"caption\":\"Jho\"},\"description\":\"Saya akan berbagi tulisan tentang definisi apapun yang berkaitan dengan dunia hosting, domain dan website.\",\"url\":\"https:\\\/\\\/www.jogjahost.co.id\\\/blog\\\/author\\\/jho\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Apa itu Web Scraping? Cara Kerja, Teknik & Kegunaannya","description":"Apa itu web scraping? web scraping adalah metode pengumpulan data dengan mengekstraksi data-data spesifik pada sejumlah halaman web.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/www.jogjahost.co.id\/blog\/apa-itu-web-scraping\/","og_locale":"en_US","og_type":"article","og_title":"Apa itu Web Scraping? Cara Kerja, Teknik & Kegunaannya","og_description":"Apa itu web scraping? web scraping adalah metode pengumpulan data dengan mengekstraksi data-data spesifik pada sejumlah halaman web.","og_url":"https:\/\/www.jogjahost.co.id\/blog\/apa-itu-web-scraping\/","og_site_name":"Jogjahost Blog","article_publisher":"https:\/\/www.facebook.com\/hostingindonesia","article_published_time":"2023-02-23T16:16:39+00:00","og_image":[{"width":800,"height":400,"url":"https:\/\/www.jogjahost.co.id\/blog\/wp-content\/uploads\/2021\/03\/Apa-itu-Web-Scraping.png","type":"image\/png"}],"author":"Jho","twitter_card":"summary_large_image","twitter_misc":{"Written by":"Jho","Est. reading time":"6 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/www.jogjahost.co.id\/blog\/apa-itu-web-scraping\/#article","isPartOf":{"@id":"https:\/\/www.jogjahost.co.id\/blog\/apa-itu-web-scraping\/"},"author":{"name":"Jho","@id":"https:\/\/www.jogjahost.co.id\/blog\/#\/schema\/person\/f7c992b57236db3af7c9b4981c748892"},"headline":"Apa itu Web Scraping? Cara Kerja, Teknik &#038; Kegunaannya","datePublished":"2023-02-23T16:16:39+00:00","mainEntityOfPage":{"@id":"https:\/\/www.jogjahost.co.id\/blog\/apa-itu-web-scraping\/"},"wordCount":1099,"commentCount":0,"publisher":{"@id":"https:\/\/www.jogjahost.co.id\/blog\/#organization"},"image":{"@id":"https:\/\/www.jogjahost.co.id\/blog\/apa-itu-web-scraping\/#primaryimage"},"thumbnailUrl":"https:\/\/www.jogjahost.co.id\/blog\/wp-content\/uploads\/2021\/03\/Apa-itu-Web-Scraping.png","articleSection":["Serba Serbi"],"inLanguage":"en-US","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/www.jogjahost.co.id\/blog\/apa-itu-web-scraping\/#respond"]}]},{"@type":"WebPage","@id":"https:\/\/www.jogjahost.co.id\/blog\/apa-itu-web-scraping\/","url":"https:\/\/www.jogjahost.co.id\/blog\/apa-itu-web-scraping\/","name":"Apa itu Web Scraping? Cara Kerja, Teknik & Kegunaannya","isPartOf":{"@id":"https:\/\/www.jogjahost.co.id\/blog\/#website"},"primaryImageOfPage":{"@id":"https:\/\/www.jogjahost.co.id\/blog\/apa-itu-web-scraping\/#primaryimage"},"image":{"@id":"https:\/\/www.jogjahost.co.id\/blog\/apa-itu-web-scraping\/#primaryimage"},"thumbnailUrl":"https:\/\/www.jogjahost.co.id\/blog\/wp-content\/uploads\/2021\/03\/Apa-itu-Web-Scraping.png","datePublished":"2023-02-23T16:16:39+00:00","description":"Apa itu web scraping? web scraping adalah metode pengumpulan data dengan mengekstraksi data-data spesifik pada sejumlah halaman web.","breadcrumb":{"@id":"https:\/\/www.jogjahost.co.id\/blog\/apa-itu-web-scraping\/#breadcrumb"},"inLanguage":"en-US","potentialAction":[{"@type":"ReadAction","target":["https:\/\/www.jogjahost.co.id\/blog\/apa-itu-web-scraping\/"]}]},{"@type":"ImageObject","inLanguage":"en-US","@id":"https:\/\/www.jogjahost.co.id\/blog\/apa-itu-web-scraping\/#primaryimage","url":"https:\/\/www.jogjahost.co.id\/blog\/wp-content\/uploads\/2021\/03\/Apa-itu-Web-Scraping.png","contentUrl":"https:\/\/www.jogjahost.co.id\/blog\/wp-content\/uploads\/2021\/03\/Apa-itu-Web-Scraping.png","width":800,"height":400,"caption":"Apa itu Web Scraping"},{"@type":"BreadcrumbList","@id":"https:\/\/www.jogjahost.co.id\/blog\/apa-itu-web-scraping\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Beranda","item":"https:\/\/www.jogjahost.co.id\/blog\/"},{"@type":"ListItem","position":2,"name":"Serba Serbi","item":"https:\/\/www.jogjahost.co.id\/blog\/category\/serba-serbi\/"},{"@type":"ListItem","position":3,"name":"Apa itu Web Scraping? Cara Kerja, Teknik &#038; Kegunaannya"}]},{"@type":"WebSite","@id":"https:\/\/www.jogjahost.co.id\/blog\/#website","url":"https:\/\/www.jogjahost.co.id\/blog\/","name":"Jogjahost Blog","description":"Official","publisher":{"@id":"https:\/\/www.jogjahost.co.id\/blog\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/www.jogjahost.co.id\/blog\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"en-US"},{"@type":"Organization","@id":"https:\/\/www.jogjahost.co.id\/blog\/#organization","name":"Jogjahost","url":"https:\/\/www.jogjahost.co.id\/blog\/","logo":{"@type":"ImageObject","inLanguage":"en-US","@id":"https:\/\/www.jogjahost.co.id\/blog\/#\/schema\/logo\/image\/","url":"https:\/\/www.jogjahost.co.id\/blog\/wp-content\/uploads\/2020\/11\/Jogjahost-Logo.png","contentUrl":"https:\/\/www.jogjahost.co.id\/blog\/wp-content\/uploads\/2020\/11\/Jogjahost-Logo.png","width":200,"height":63,"caption":"Jogjahost"},"image":{"@id":"https:\/\/www.jogjahost.co.id\/blog\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.facebook.com\/hostingindonesia","https:\/\/www.linkedin.com\/in\/ptjogjahost\/","https:\/\/www.youtube.com\/channel\/UCNjzg7FZMoDlHQRvztXTZQA\/featured"]},{"@type":"Person","@id":"https:\/\/www.jogjahost.co.id\/blog\/#\/schema\/person\/f7c992b57236db3af7c9b4981c748892","name":"Jho","image":{"@type":"ImageObject","inLanguage":"en-US","@id":"https:\/\/secure.gravatar.com\/avatar\/1a940f9df7d6eb39176ff487c642337071de767315e1b2ceed9d358ddd0d5207?s=96&d=blank&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/1a940f9df7d6eb39176ff487c642337071de767315e1b2ceed9d358ddd0d5207?s=96&d=blank&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/1a940f9df7d6eb39176ff487c642337071de767315e1b2ceed9d358ddd0d5207?s=96&d=blank&r=g","caption":"Jho"},"description":"Saya akan berbagi tulisan tentang definisi apapun yang berkaitan dengan dunia hosting, domain dan website.","url":"https:\/\/www.jogjahost.co.id\/blog\/author\/jho\/"}]}},"_links":{"self":[{"href":"https:\/\/www.jogjahost.co.id\/blog\/wp-json\/wp\/v2\/posts\/1190","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.jogjahost.co.id\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.jogjahost.co.id\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.jogjahost.co.id\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.jogjahost.co.id\/blog\/wp-json\/wp\/v2\/comments?post=1190"}],"version-history":[{"count":5,"href":"https:\/\/www.jogjahost.co.id\/blog\/wp-json\/wp\/v2\/posts\/1190\/revisions"}],"predecessor-version":[{"id":1325,"href":"https:\/\/www.jogjahost.co.id\/blog\/wp-json\/wp\/v2\/posts\/1190\/revisions\/1325"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.jogjahost.co.id\/blog\/wp-json\/wp\/v2\/media\/1321"}],"wp:attachment":[{"href":"https:\/\/www.jogjahost.co.id\/blog\/wp-json\/wp\/v2\/media?parent=1190"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.jogjahost.co.id\/blog\/wp-json\/wp\/v2\/categories?post=1190"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.jogjahost.co.id\/blog\/wp-json\/wp\/v2\/tags?post=1190"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}