Browse Wiki & Semantic Web

Jump to: navigation, search
Http://dbpedia.org/resource/Web scraping
  This page has no properties.
hide properties that link here 
  No properties link to this page.
 
http://dbpedia.org/resource/Web_scraping
http://dbpedia.org/ontology/abstract Веб-скрейпинг (или скрепинг, или скрапинг←Веб-скрейпинг (или скрепинг, или скрапинг← англ. web scraping) — это технология получения веб-данных путем извлечения их со страниц веб-ресурсов. Веб-скрейпинг может быть сделан вручную пользователем компьютера, однако термин обычно относится к автоматизированным процессам, реализованным с помощью кода, который выполняет GET-запросы на целевой сайт. Веб-скрейпинг используется для синтаксического преобразования веб-страниц в более удобные для работы формы. Веб-страницы создаются с использованием текстовых языков разметки (HTML и XHTML) и содержат множество полезных данных в коде. Однако большинство веб-ресурсов предназначено для конечных пользователей, а не для удобства автоматического использования, поэтому была разработана технология, которая «очищает» веб-контент. Загрузка и просмотр страницы — важнейшие составляющие технологии, они являются неотъемлемой частью выборки данных.ляются неотъемлемой частью выборки данных. , Web scraping, web harvesting nebo extrakceWeb scraping, web harvesting nebo extrakce dat z webu označují způsob získávání z webových stránek. Spočívá v extrahování dat umístěných na webových stránkách do užitečnějšího formátu, který je možné snadno dále . Web scraping je sice možné provádět ručně, častěji se ale termín používá pro automatické harvestování, prováděné pomocí web crawlerů. Web harvesting je formou stahování dat z webu, v průběhu kterého se z webu stahují konkrétní data a ukládají se do databáze nebo tabulky, aby s nimi bylo možné později pracovat. Web scraping webové stránky zahrnuje její načtení a extrakci z ní. Fetching je stahování stránky (které provádí prohlížeč, když si uživatel stránku prohlíží). Proto je web crawling hlavní součástí web scrapingu, aby se stránky získaly pro pozdější zpracování. Po načtení může následovat extrakce. Obsah stránky může být analyzován, prohledáván, přeformátován, mohou z ní být data zkopírovaná do tabulky nebo vložena do databáze. Web scrapery obvykle ze stránky něco vyjmou, aby to využily k jinému účelu na jiném místě. to využily k jinému účelu na jiném místě. , Il web scraping (detto anche web harvestinIl web scraping (detto anche web harvesting o web data extraction) è una tecnica informatica di da un sito web per mezzo di programmi software. Di solito, tali programmi simulano la navigazione umana nel World Wide Web utilizzando l'Hypertext Transfer Protocol (HTTP) o attraverso browser, come Internet Explorer o Mozilla Firefox. Strettamente correlato all'indicizzazione dei siti Internet, tale tecnica è attuata mediante l'uso di bot dalla maggior parte dei motori di ricerca. D'altro canto, il web scraping si concentra di più sulla trasformazione di dati non strutturati presenti in Rete, di solito in formato HTML, in metadati che possono essere memorizzati e analizzati in locale in un database. Il web harvesting è altresì affine alla , che consiste nella simulazione della navigazione umana in Rete attraverso l'uso di software per computer. Esistono metodi utilizzati da alcuni siti web per prevenire il web scraping , come ad esempio rilevare e impedire ai bot la visualizzazione delle loro pagine. Per aggirare il problema esistono sistemi di web scraping che si affidano a tecniche come DOM parsing, Computer Vision e natural language processing per simulare la navigazione web umana. Grazie a queste tecniche è possibile raccogliere i contenuti delle pagine web per l'analisi offline. Può essere usato per confrontare prezzi online, monitorare dati meteorologici, rilevare modifiche in un sito internet, nella ricerca scientifica, per il web mashup e il .erca scientifica, per il web mashup e il . , 网页抓取(英語:web scraping)是一种从网页上获取页面内容的计算机软件技术网页抓取(英語:web scraping)是一种从网页上获取页面内容的计算机软件技术。通常透過软件使用低级别的超文本传输协议模仿人类的正常访问。 网页抓取和网页索引极其相似,其中网页索引指的是大多数搜索引擎采用使用的机器人或网络爬虫等技术。与此相反,网页抓取更侧重于转换网络上非结构化数据(常见的是HTML格式)成为能在一个中央数据库和电子表格中储存和分析的结构化数据。网页抓取也涉及到网络自动化,它利用计算机软件模拟了人的浏览。网页抓取的用途包括在线的价格比较,联系人抓取,气象数据监测,网页变化检测,科研,混搭和Web数据集成。在线的价格比较,联系人抓取,气象数据监测,网页变化检测,科研,混搭和Web数据集成。 , Web scraping, web harvesting, or web data Web scraping, web harvesting, or web data extraction is data scraping used for extracting data from websites. Web scraping software may directly access the World Wide Web using the Hypertext Transfer Protocol or a web browser. While web scraping can be done manually by a software user, the term typically refers to automated processes implemented using a bot or web crawler. It is a form of copying in which specific data is gathered and copied from the web, typically into a central local database or spreadsheet, for later retrieval or analysis. Scraping a web page involves fetching it and extracting from it. Fetching is the downloading of a page (which a browser does when a user views a page). Therefore, web crawling is a main component of web scraping, to fetch pages for later processing. Once fetched, extraction can take place. The content of a page may be parsed, searched and reformatted, and its data copied into a spreadsheet or loaded into a database. Web scrapers typically take something out of a page, to make use of it for another purpose somewhere else. An example would be finding and copying names and telephone numbers, companies and their URLs, or e-mail addresses to a list (contact scraping). As well as contact scraping, web scraping is used as a component of applications used for web indexing, web mining and data mining, online price change monitoring and price comparison, product review scraping (to watch the competition), gathering real estate listings, weather data monitoring, website change detection, research, tracking online presence and reputation, web mashup, and web data integration. Web pages are built using text-based mark-up languages (HTML and XHTML), and frequently contain a wealth of useful data in text form. However, most web pages are designed for human end-users and not for ease of automated use. As a result, specialized tools and software have been developed to facilitate the scraping of web pages. Newer forms of web scraping involve monitoring data feeds from web servers. For example, JSON is commonly used as a transport storage mechanism between the client and the web server. There are methods that some websites use to prevent web scraping, such as detecting and disallowing bots from crawling (viewing) their pages. In response, there are web scraping systems that rely on using techniques in DOM parsing, computer vision and natural language processing to simulate human browsing to enable gathering web page content for offline parsing.ring web page content for offline parsing. , ウェブスクレイピング(英: Web scraping)とは、ウェブサイトから情報を抽ウェブスクレイピング(英: Web scraping)とは、ウェブサイトから情報を抽出するコンピュータソフトウェア技術のこと。通常このようなソフトウェアプログラムは低レベルのHTTPを実装することで、もしくはウェブブラウザを埋め込むことによって、WWWのコンテンツを取得する。ウェブスクレイピングはユーザーが手動で行なうこともできるが、一般的にはボットやクローラ(英: Web crawler)を利用した自動化プロセスを指す。 ウェブスクレイピングは多くの検索エンジンによって採用されている、ボットを利用してウェブ上の情報にインデックス付けを行うと密接な関係がある。ウェブスクレイピングではウェブ上の非構造化データの変換、一般的にはHTMLフォーマットからデータベースやスプレッドシートに格納・分析可能な構造化データへの変換に、より焦点が当てられている。また、コンピュータソフトウェアを利用して人間のブラウジングをシミュレートするウェブオートメーションとも関係が深い。ウェブスクレイピングの用途は、オンラインでの価格比較、気象データ監視、ウェブサイトの変更検出、研究、ウェブマッシュアップやウェブデータの統合等である。視、ウェブサイトの変更検出、研究、ウェブマッシュアップやウェブデータの統合等である。 , Web scraping o raspado web, es una técnicaWeb scraping o raspado web, es una técnica utilizada mediante programas de software para extraer información de sitios web.​ Usualmente, estos programas simulan la navegación de un humano en la World Wide Web ya sea utilizando el protocolo HTTP manualmente, o incrustando un navegador en una aplicación. El web scraping está muy relacionado con la indexación de la web, la cual indexa la información de la web utilizando un robot y es una técnica universal adoptada por la mayoría de los motores de búsqueda. Sin embargo, el web scraping se enfoca más en la transformación de datos sin estructura en la web (como el formato HTML) en datos estructurados que pueden ser almacenados y analizados en una base de datos central, en una hoja de cálculo o en alguna otra fuente de almacenamiento. Alguno de los usos del web scraping son la comparación de precios en tiendas, la monitorización de datos relacionados con el clima de cierta región, la detección de cambios en sitios webs y la integración de datos en sitios webs. También es utilizado para obtener información relevante de un sitio a través de los rich snippets. En los últimos años el web scraping se ha convertido en una técnica muy utilizada dentro del sector del posicionamiento web gracias a su capacidad de generar grandes cantidades de datos para crear contenidos de calidad.​e datos para crear contenidos de calidad.​ , Web scraping (de l'anglès to scrap 'rasclaWeb scraping (de l'anglès to scrap 'rasclar') és una tècnica de programari o software informàtic per extreure informació dels llocs web. En general, aquest tipus de programes de software simulen l'exploració humana del World Wide Web, ja sigui amb la implementació de baix nivell de protocol de transferència d'hipertext (HTTP), o amb la incorporació d'un navegador web, com pot ser Internet Explorer o Mozilla Firefox. El web scraping està molt relacionat amb la indexació de la web, que indexa informació de la web utilitzant un robot. Aquesta tècnica és una tècnica universal adoptada per la majoria dels motors de cerca.Per contra, el web scraping se centra més en la transformació de les dades no estructurades al web, generalment en format HTML, en dades estructurades que poden ser emmagatzemades i analitzades en una base de dades local, central o de full de càlcul. El web scraping també està relacionat amb l'automatització del web, que simula la navegació humana utilitzant software d'ordinador. Algun dels usos principals del web scraping són la comparació de preus en botigues, monitorar dades relacionades amb el clima de certa regió, detectar canvis en llocs webs o la integració de dades en llocs web.ebs o la integració de dades en llocs web. , تجريف الويب (بالإنجليزية: Web scraping)‏ هتجريف الويب (بالإنجليزية: Web scraping)‏ هي تقنية استخراج البيانات من مواقع الإنترنت عن طريق برامج مخصصة مثل برامج محاكة تصفح الأشخاص للإنترنت تعمل على مستوى منخفض من بروتوكول (HTTP) نقل النص التشعبي أو دمج متصفح ويب متكامل، مثل موزيلا فايرفوكس. تحليل الويب متعلق أيضًا بفهرسة الويب الذي يعنى فهرسة المعلومات الويب باستخدام البوت أو زاحف الشبكة وهي تقنية عالمية تعتمدها أغلب محركات البحث.ويركز تحليل الويب أكثر على تحويل البيانات غير المنظمة على الويب والتي عادة على شكل HTML إلى البيانات المنظمة التي يمكن تخزينها وتحليلها في قاعدة بيانات محلية المركزية أو جدول البيانات. وهو أيضًا يشمل على التصفح إلى الويب الذي يشابه تصفح الأشخاص للويب. تشمل استخدامات تحليل شبكة الإنترنت مقارنة الأسعار على الإنترنت، تحليل الايميلات ورصد بيانات الطقس، على شبكة الإنترنت لكشف التغيرات، والبحوث، والمزج على شبكة الإنترنت وتكامل البيانات على الشبكة. شبكة الإنترنت وتكامل البيانات على الشبكة. , Web scraping software-programen bidez web Web scraping software-programen bidez web guneetatik informazioa ateratzeko erabilitako teknika bat da. Normalean, programa horiek Webean pertsona bat nabigatzen dutela simulatzen dute, HTTP protokoloa eskuz erabilita, edo nabigatzaile bat aplikazio batean txertatuz. Azken urteotan, web-scraping-a asko erabiltzen da web-posizionamenduaren sektorean, kalitatezko edukiak sortzeko datu kopuru handiak jaso eta antolatzeko dituen gaitasunarengatik. eta antolatzeko dituen gaitasunarengatik. , Web scraping, web harvesting, atau web datWeb scraping, web harvesting, atau web data extraction merupakan kegiatan yang dilakukan untuk mengambil data tertentu secara semi-terstruktur dari sebuah halaman situs web. Halaman tersebut umumnya dibangun menggunakan bahasa markup seperti HTML atau XHTML, proses akan menganalisis dokumen sebelum memulai mengambil data. Biasanya teknik scraping diimplementasikan pada sebuah bot agar bisa membuat proses yang harusnya dilakukan secara manual menjadi otomatis. Ketika kita menjumpai sebuah situs yang membatasi kuota API (application programming interface) atau bahkan tidak menyediakan sama sekali, maka perayapan web akan sangat dibutuhkan sebagai langkah pengambilan data.butuhkan sebagai langkah pengambilan data. , Le web scraping (parfois appelé harvestingLe web scraping (parfois appelé harvesting) est une technique d'extraction du contenu de sites Web, via un script ou un programme, dans le but de le transformer pour permettre son utilisation dans un autre contexte comme l'enrichissement de bases de données, le référencement ou l'exploration de données.référencement ou l'exploration de données. , Der Begriff Screen Scraping (engl., etwa: Der Begriff Screen Scraping (engl., etwa: „am Bildschirm schürfen“) umfasst generell alle Verfahren zum Auslesen von Texten aus Computerbildschirmen. Gegenwärtig wird der Ausdruck jedoch beinahe ausschließlich in Bezug auf Webseiten verwendet (daher auch Web Scraping oder Web Harvesting). In diesem Fall bezeichnet Screen Scraping speziell die Techniken, die der Gewinnung von Informationen durch gezieltes Extrahieren der benötigten Daten dienen.s Extrahieren der benötigten Daten dienen. , A coleta de dados web, ou raspagem web, é A coleta de dados web, ou raspagem web, é uma forma de mineração que permite a extração de dados de sites da web convertendo-os em informação estruturada para posterior análise. O tipo mais básico de coleta é o download manual das páginas, copiando e colando o conteúdo, e isso pode ser feito por qualquer pessoa. Contudo, essa técnica geralmente é feita através de um software que simula uma navegação humana por diversos sites, extraindo informações específicas. É um campo com ativa evolução que compartilha um objetivo comum com a visão da web semântica, uma iniciativa ambiciosa que ainda requer avanços no processamento de texto, compreensão semantical, inteligência artificial e interação humano-computador. A coleta de dados web é muito semelhante à indexação web (utilizado pela maioria dos motores de busca), mas a motivação final é muito diferente. A indexação web é usada para ajudar a tornar os motores de busca mais eficientes, já a coleta de dados é tipicamente usada para diferentes razões, como comparação de preços online, monitoramentos meteorológicos, pesquisas de mercado, coleta de dados governamentais, monitoramento de dados e, em alguns casos, roubo.amento de dados e, em alguns casos, roubo. , Scrapen (Engels: web scraping) is een compScrapen (Engels: web scraping) is een computertechniek waarbij software wordt gebruikt om informatie van webpagina's te extraheren en al dan niet te analyseren. Meestal probeert de software een deel van het world wide web te onderzoeken via gebruik van het op codes gebaseerde Hypertext Transfer Protocol (HTTP), of door het surfgedrag met een webbrowser zoals Mozilla Firefox te simuleren. Scrapen is sterk gerelateerd aan web-indexering, waarmee een bot of een web-crawler op een automatische manier de informatie verzamelt en categoriseert, een techniek die universeel wordt toegepast door de meeste zoekmachines. Scrapen daarentegen focust zich vooral op de omzetting van ongestructureerde data, meestal in HTML-formaat, naar gestructureerde data die kan worden bewaard en geanalyseerd in een centrale lokale database of spreadsheet. Behalve door zoekmachines wordt de techniek ook vaak ingezet voor het vergaren van data wanneer de aanbieder ervan deze niet op een gestructureerde manier weggeeft of verkoopt, zoals met een API. Voorbeelden van scrapen zijn online prijsvergelijkingen, verzamelen van contactgegevens, nieuwsartikelen, monitoring van weergegevens, detectie van wijzigingen aan websites, onderzoek, web-mashup en webdata-integratie.derzoek, web-mashup en webdata-integratie. , Вебскрапінг (від англ. scraping — «вишкрібВебскрапінг (від англ. scraping — «вишкрібання», вебзбирання або витягнення вебданих) — перетворення у структуровані дані інформації з вебсторінок, які призначені для перегляду людиною за допомогою браузера. Як правило, виконується за допомогою комп'ютерних програм, що імітують поведінку людини в інтернеті, або з'єднуючись з вебсервером напряму по протоколу HTTP, або управляючи повноцінним веббраузером. Але буває і скрапінг за допомогою копіювання даних людиною. Це форма копіювання, в якій конкретні дані збираються та копіюються з інтернету, як правило, в базу даних або електронну таблицю для подальшого пошуку чи аналізу. Вебскрапінг включає в себе завантаження та вилучення. Спочатку завантажується сторінка (що робить браузер, коли ви переглядаєте сторінку), після цього можна добувати потрібну інформацію. Зміст сторінки може бути проаналізовано, переформатовано, його дані скопійовані в електронну таблицю тощо. Вебскрапери, як правило, беруть щось із сторінки, щоб використати це для інших цілей деінде. Прикладом може бути пошук і копіювання імен та телефонних номерів або компаній та їх URL-адрес до списку (контактне сканування). Вебсторінки побудовані за допомогою текстових мов розмітки (HTML та XHTML) і часто містять велику кількість корисних даних у текстовій формі. Однак більшість вебсторінок призначені для кінцевих користувачів, а не для зручності автоматичного використання. Через це були створені набори інструментів, які «збирають» вебвміст. Вебскрапери — це прикладний програмний інтерфейс для вилучення даних з вебсайту. Існують методи, які деякі вебсайти використовують для запобігання вебскрапінгу. Наприклад, виявлення та заборона ботів від сканування (перегляду) своїх сторінок. У відповідь на це існують вебскрапінгові системи, які спираються на використання методів аналізу об'єктної моделі документа, комп'ютерного бачення та обробку тексту природною мовою, щоб імітувати пошук людини, щоб дозволити збирати вміст вебсторінок для автономного синтаксичного аналізу.нок для автономного синтаксичного аналізу.
http://dbpedia.org/ontology/wikiPageID 2696619
http://dbpedia.org/ontology/wikiPageLength 29388
http://dbpedia.org/ontology/wikiPageRevisionID 1119386562
http://dbpedia.org/ontology/wikiPageWikiLink http://dbpedia.org/resource/Change_detection_and_notification + , http://dbpedia.org/resource/Spamdexing + , http://dbpedia.org/resource/Terms_of_use + , http://dbpedia.org/resource/Hypertext_Transfer_Protocol + , http://dbpedia.org/resource/End-user_%28computer_science%29 + , http://dbpedia.org/resource/JumpStation + , http://dbpedia.org/resource/EBay + , http://dbpedia.org/resource/JSON + , http://dbpedia.org/resource/Mozilla + , http://dbpedia.org/resource/Robots_exclusion_standard + , http://dbpedia.org/resource/Clickwrap + , http://dbpedia.org/resource/Electronic_Frontier_Foundation + , http://dbpedia.org/resource/XHTML + , http://dbpedia.org/resource/CAPTCHA + , http://dbpedia.org/resource/Craigslist_v._3Taps + , http://dbpedia.org/resource/DNSBL + , http://dbpedia.org/resource/Website + , http://dbpedia.org/resource/Parsing + , http://dbpedia.org/resource/Static_web_page + , http://dbpedia.org/resource/American_Airlines + , http://dbpedia.org/resource/Web_accessibility + , http://dbpedia.org/resource/Microformat + , http://dbpedia.org/resource/Cause_of_action + , http://dbpedia.org/resource/Auction_sniping + , http://dbpedia.org/resource/Internet_Archive + , http://dbpedia.org/resource/Wrapper_%28data_mining%29 + , http://dbpedia.org/resource/Semantic_web + , http://dbpedia.org/resource/Scraper_site + , http://dbpedia.org/resource/Geolocation + , http://dbpedia.org/resource/Application_firewall + , http://dbpedia.org/resource/Importer_%28computing%29 + , http://dbpedia.org/resource/Category:Web_crawlers + , http://dbpedia.org/resource/Application_programming_interface + , http://dbpedia.org/resource/Link_farm + , http://dbpedia.org/resource/Contact_scraping + , http://dbpedia.org/resource/Fake_news_website + , http://dbpedia.org/resource/Archive.today + , http://dbpedia.org/resource/Perl + , http://dbpedia.org/resource/Metadata + , http://dbpedia.org/resource/Grep + , http://dbpedia.org/resource/Comparison_shopping_website + , http://dbpedia.org/resource/Search_engine_scraping + , http://dbpedia.org/resource/Maritime_and_Commercial_Court_%28Denmark%29 + , http://dbpedia.org/resource/String_%28computer_science%29 + , http://dbpedia.org/resource/Ryanair + , http://dbpedia.org/resource/Computer_vision + , http://dbpedia.org/resource/World_Wide_Web_Wanderer + , http://dbpedia.org/resource/Feist_Publications%2C_Inc.%2C_v._Rural_Telephone_Service_Co. + , http://dbpedia.org/resource/Associated_Press_v._Meltwater_U.S._Holdings%2C_Inc. + , http://dbpedia.org/resource/Web_service + , http://dbpedia.org/resource/Facebook%2C_Inc._v._Power_Ventures%2C_Inc. + , http://dbpedia.org/resource/US_Copyright_law + , http://dbpedia.org/resource/Data_extraction + , http://dbpedia.org/resource/Socket_programming + , http://dbpedia.org/resource/Web_mashup + , http://dbpedia.org/resource/Text_corpus + , http://dbpedia.org/resource/XQuery + , http://dbpedia.org/resource/United_States_District_Court_for_the_Eastern_District_of_Pennsylvania + , http://dbpedia.org/resource/XPath + , http://dbpedia.org/resource/Information_Technology_Act%2C_2000 + , http://dbpedia.org/resource/Internet_bot + , http://dbpedia.org/resource/Defendant + , http://dbpedia.org/resource/OpenSocial + , http://dbpedia.org/resource/Regular_expression + , http://dbpedia.org/resource/Honeypot_%28computing%29 + , http://dbpedia.org/resource/Knowledge_extraction + , http://dbpedia.org/resource/EBay_v._Bidder%27s_Edge + , http://dbpedia.org/resource/Web_page + , http://dbpedia.org/resource/Offline_reader + , http://dbpedia.org/resource/IP_address + , http://dbpedia.org/resource/Job_wrapping + , http://dbpedia.org/resource/Googlebot + , http://dbpedia.org/resource/Web_crawler + , http://dbpedia.org/resource/User_agent + , http://dbpedia.org/resource/Human-computer_interaction + , http://dbpedia.org/resource/Personal_property + , http://dbpedia.org/resource/Screen_reader + , http://dbpedia.org/resource/Category:Web_scraping + , http://dbpedia.org/resource/Screen_scraping + , http://dbpedia.org/resource/Spam_Act_2003 + , http://dbpedia.org/resource/Internet_Explorer + , http://dbpedia.org/resource/Data_analysis + , http://dbpedia.org/resource/Database + , http://dbpedia.org/resource/Web_indexing + , http://dbpedia.org/resource/Web_mining + , http://dbpedia.org/resource/Yahoo%21 + , http://dbpedia.org/resource/Inchoate_offense + , http://dbpedia.org/resource/Data_mining + , http://dbpedia.org/resource/Michael_Hanna_%28judge%29 + , http://dbpedia.org/resource/QVC + , http://dbpedia.org/resource/Natural_language_processing + , http://dbpedia.org/resource/Computer_Fraud_and_Abuse_Act + , http://dbpedia.org/resource/World_Wide_Web + , http://dbpedia.org/resource/Salesforce.com + , http://dbpedia.org/resource/Browse_wrap + , http://dbpedia.org/resource/Plaintiff + , http://dbpedia.org/resource/Southwest_Airlines + , http://dbpedia.org/resource/Data_wrangling + , http://dbpedia.org/resource/Blog_scraping + , http://dbpedia.org/resource/Obfuscation + , http://dbpedia.org/resource/Supreme_Court_of_the_United_States + , http://dbpedia.org/resource/History_of_the_World_Wide_Web + , http://dbpedia.org/resource/Comparison_of_feed_aggregators + , http://dbpedia.org/resource/Cvent%2C_Inc. + , http://dbpedia.org/resource/Semi-structured_data + , http://dbpedia.org/resource/HTML + , http://dbpedia.org/resource/AJAX + , http://dbpedia.org/resource/Headless_browser + , http://dbpedia.org/resource/Machine_learning + , http://dbpedia.org/resource/Eventbrite + , http://dbpedia.org/resource/Trespass_to_chattels + , http://dbpedia.org/resource/Web_archiving + , http://dbpedia.org/resource/Injunction + , http://dbpedia.org/resource/Document_Object_Model + , http://dbpedia.org/resource/Long_Tail + , http://dbpedia.org/resource/Data_retrieval + , http://dbpedia.org/resource/Dynamic_web_page + , http://dbpedia.org/resource/Web_data_integration + , http://dbpedia.org/resource/Data_scraping + , http://dbpedia.org/resource/Domain_name_drop_list + , http://dbpedia.org/resource/CSS_sprite + , http://dbpedia.org/resource/Python_%28programming_language%29 +
http://dbpedia.org/property/wikiPageUsesTemplate http://dbpedia.org/resource/Template:Short_description + , http://dbpedia.org/resource/Template:Unreferenced_section + , http://dbpedia.org/resource/Template:More_citations_needed + , http://dbpedia.org/resource/Template:Not_a_typo + , http://dbpedia.org/resource/Template:Div_col + , http://dbpedia.org/resource/Template:Div_col_end + , http://dbpedia.org/resource/Template:Further + , http://dbpedia.org/resource/Template:Reflist + , http://dbpedia.org/resource/Template:Globalize + , http://dbpedia.org/resource/Template:Broader +
http://purl.org/dc/terms/subject http://dbpedia.org/resource/Category:Web_scraping +
http://purl.org/linguistics/gold/hypernym http://dbpedia.org/resource/Technique +
http://www.w3.org/ns/prov#wasDerivedFrom http://en.wikipedia.org/wiki/Web_scraping?oldid=1119386562&ns=0 +
http://xmlns.com/foaf/0.1/isPrimaryTopicOf http://en.wikipedia.org/wiki/Web_scraping +
owl:sameAs http://es.dbpedia.org/resource/Web_scraping + , http://ar.dbpedia.org/resource/%D8%AA%D8%AC%D8%B1%D9%8A%D9%81_%D9%88%D9%8A%D8%A8 + , http://nl.dbpedia.org/resource/Scrapen + , http://is.dbpedia.org/resource/Vefs%C3%B6fnun + , http://it.dbpedia.org/resource/Web_scraping + , http://www.wikidata.org/entity/Q665452 + , http://id.dbpedia.org/resource/Web_scraping + , http://yago-knowledge.org/resource/Web_scraping + , http://dbpedia.org/resource/Web_scraping + , http://pt.dbpedia.org/resource/Coleta_de_dados_web + , http://cs.dbpedia.org/resource/Web_scraping + , http://rdf.freebase.com/ns/m.07ykbs + , http://uk.dbpedia.org/resource/Web_scraping + , http://eu.dbpedia.org/resource/Web_scraping + , http://zh.dbpedia.org/resource/%E7%BD%91%E9%A1%B5%E6%8A%93%E5%8F%96 + , http://de.dbpedia.org/resource/Screen_Scraping + , http://lv.dbpedia.org/resource/Rasmo%C5%A1ana + , http://ja.dbpedia.org/resource/%E3%82%A6%E3%82%A7%E3%83%96%E3%82%B9%E3%82%AF%E3%83%AC%E3%82%A4%E3%83%94%E3%83%B3%E3%82%B0 + , http://fr.dbpedia.org/resource/Web_scraping + , http://tr.dbpedia.org/resource/Web_kaz%C4%B1ma + , http://ru.dbpedia.org/resource/%D0%92%D0%B5%D0%B1-%D1%81%D0%BA%D1%80%D0%B5%D0%B9%D0%BF%D0%B8%D0%BD%D0%B3 + , http://ca.dbpedia.org/resource/Web_scraping + , https://global.dbpedia.org/id/4qe7A +
rdf:type http://dbpedia.org/ontology/MusicGenre + , http://dbpedia.org/ontology/TopicalConcept +
rdfs:comment Web scraping, web harvesting nebo extrakceWeb scraping, web harvesting nebo extrakce dat z webu označují způsob získávání z webových stránek. Spočívá v extrahování dat umístěných na webových stránkách do užitečnějšího formátu, který je možné snadno dále . Web scraping je sice možné provádět ručně, častěji se ale termín používá pro automatické harvestování, prováděné pomocí web crawlerů. Web harvesting je formou stahování dat z webu, v průběhu kterého se z webu stahují konkrétní data a ukládají se do databáze nebo tabulky, aby s nimi bylo možné později pracovat.y, aby s nimi bylo možné později pracovat. , Вебскрапінг (від англ. scraping — «вишкрібання», вебзбирання або витягнення вебданих) — перетворення у структуровані дані інформації з вебсторінок, які призначені для перегляду людиною за допомогою браузера. , Веб-скрейпинг (или скрепинг, или скрапинг←Веб-скрейпинг (или скрепинг, или скрапинг← англ. web scraping) — это технология получения веб-данных путем извлечения их со страниц веб-ресурсов. Веб-скрейпинг может быть сделан вручную пользователем компьютера, однако термин обычно относится к автоматизированным процессам, реализованным с помощью кода, который выполняет GET-запросы на целевой сайт. Загрузка и просмотр страницы — важнейшие составляющие технологии, они являются неотъемлемой частью выборки данных.ляются неотъемлемой частью выборки данных. , Der Begriff Screen Scraping (engl., etwa: Der Begriff Screen Scraping (engl., etwa: „am Bildschirm schürfen“) umfasst generell alle Verfahren zum Auslesen von Texten aus Computerbildschirmen. Gegenwärtig wird der Ausdruck jedoch beinahe ausschließlich in Bezug auf Webseiten verwendet (daher auch Web Scraping oder Web Harvesting). In diesem Fall bezeichnet Screen Scraping speziell die Techniken, die der Gewinnung von Informationen durch gezieltes Extrahieren der benötigten Daten dienen.s Extrahieren der benötigten Daten dienen. , A coleta de dados web, ou raspagem web, é A coleta de dados web, ou raspagem web, é uma forma de mineração que permite a extração de dados de sites da web convertendo-os em informação estruturada para posterior análise. O tipo mais básico de coleta é o download manual das páginas, copiando e colando o conteúdo, e isso pode ser feito por qualquer pessoa. Contudo, essa técnica geralmente é feita através de um software que simula uma navegação humana por diversos sites, extraindo informações específicas. É um campo com ativa evolução que compartilha um objetivo comum com a visão da web semântica, uma iniciativa ambiciosa que ainda requer avanços no processamento de texto, compreensão semantical, inteligência artificial e interação humano-computador. A coleta de dados web é muito semelhante à indexação web (utilizado pela maioria dos indexação web (utilizado pela maioria dos , 网页抓取(英語:web scraping)是一种从网页上获取页面内容的计算机软件技术网页抓取(英語:web scraping)是一种从网页上获取页面内容的计算机软件技术。通常透過软件使用低级别的超文本传输协议模仿人类的正常访问。 网页抓取和网页索引极其相似,其中网页索引指的是大多数搜索引擎采用使用的机器人或网络爬虫等技术。与此相反,网页抓取更侧重于转换网络上非结构化数据(常见的是HTML格式)成为能在一个中央数据库和电子表格中储存和分析的结构化数据。网页抓取也涉及到网络自动化,它利用计算机软件模拟了人的浏览。网页抓取的用途包括在线的价格比较,联系人抓取,气象数据监测,网页变化检测,科研,混搭和Web数据集成。在线的价格比较,联系人抓取,气象数据监测,网页变化检测,科研,混搭和Web数据集成。 , Web scraping, web harvesting, atau web datWeb scraping, web harvesting, atau web data extraction merupakan kegiatan yang dilakukan untuk mengambil data tertentu secara semi-terstruktur dari sebuah halaman situs web. Halaman tersebut umumnya dibangun menggunakan bahasa markup seperti HTML atau XHTML, proses akan menganalisis dokumen sebelum memulai mengambil data.is dokumen sebelum memulai mengambil data. , Web scraping, web harvesting, or web data Web scraping, web harvesting, or web data extraction is data scraping used for extracting data from websites. Web scraping software may directly access the World Wide Web using the Hypertext Transfer Protocol or a web browser. While web scraping can be done manually by a software user, the term typically refers to automated processes implemented using a bot or web crawler. It is a form of copying in which specific data is gathered and copied from the web, typically into a central local database or spreadsheet, for later retrieval or analysis.eadsheet, for later retrieval or analysis. , Il web scraping (detto anche web harvestinIl web scraping (detto anche web harvesting o web data extraction) è una tecnica informatica di da un sito web per mezzo di programmi software. Di solito, tali programmi simulano la navigazione umana nel World Wide Web utilizzando l'Hypertext Transfer Protocol (HTTP) o attraverso browser, come Internet Explorer o Mozilla Firefox. come Internet Explorer o Mozilla Firefox. , تجريف الويب (بالإنجليزية: Web scraping)‏ هي تقنية استخراج البيانات من مواقع الإنترنت عن طريق برامج مخصصة مثل برامج محاكة تصفح الأشخاص للإنترنت تعمل على مستوى منخفض من بروتوكول (HTTP) نقل النص التشعبي أو دمج متصفح ويب متكامل، مثل موزيلا فايرفوكس. , Scrapen (Engels: web scraping) is een compScrapen (Engels: web scraping) is een computertechniek waarbij software wordt gebruikt om informatie van webpagina's te extraheren en al dan niet te analyseren. Meestal probeert de software een deel van het world wide web te onderzoeken via gebruik van het op codes gebaseerde Hypertext Transfer Protocol (HTTP), of door het surfgedrag met een webbrowser zoals Mozilla Firefox te simuleren.rowser zoals Mozilla Firefox te simuleren. , ウェブスクレイピング(英: Web scraping)とは、ウェブサイトから情報を抽ウェブスクレイピング(英: Web scraping)とは、ウェブサイトから情報を抽出するコンピュータソフトウェア技術のこと。通常このようなソフトウェアプログラムは低レベルのHTTPを実装することで、もしくはウェブブラウザを埋め込むことによって、WWWのコンテンツを取得する。ウェブスクレイピングはユーザーが手動で行なうこともできるが、一般的にはボットやクローラ(英: Web crawler)を利用した自動化プロセスを指す。 ウェブスクレイピングは多くの検索エンジンによって採用されている、ボットを利用してウェブ上の情報にインデックス付けを行うと密接な関係がある。ウェブスクレイピングではウェブ上の非構造化データの変換、一般的にはHTMLフォーマットからデータベースやスプレッドシートに格納・分析可能な構造化データへの変換に、より焦点が当てられている。また、コンピュータソフトウェアを利用して人間のブラウジングをシミュレートするウェブオートメーションとも関係が深い。ウェブスクレイピングの用途は、オンラインでの価格比較、気象データ監視、ウェブサイトの変更検出、研究、ウェブマッシュアップやウェブデータの統合等である。視、ウェブサイトの変更検出、研究、ウェブマッシュアップやウェブデータの統合等である。 , Web scraping software-programen bidez web Web scraping software-programen bidez web guneetatik informazioa ateratzeko erabilitako teknika bat da. Normalean, programa horiek Webean pertsona bat nabigatzen dutela simulatzen dute, HTTP protokoloa eskuz erabilita, edo nabigatzaile bat aplikazio batean txertatuz. Azken urteotan, web-scraping-a asko erabiltzen da web-posizionamenduaren sektorean, kalitatezko edukiak sortzeko datu kopuru handiak jaso eta antolatzeko dituen gaitasunarengatik. eta antolatzeko dituen gaitasunarengatik. , Web scraping o raspado web, es una técnicaWeb scraping o raspado web, es una técnica utilizada mediante programas de software para extraer información de sitios web.​ Usualmente, estos programas simulan la navegación de un humano en la World Wide Web ya sea utilizando el protocolo HTTP manualmente, o incrustando un navegador en una aplicación. En los últimos años el web scraping se ha convertido en una técnica muy utilizada dentro del sector del posicionamiento web gracias a su capacidad de generar grandes cantidades de datos para crear contenidos de calidad.​e datos para crear contenidos de calidad.​ , Le web scraping (parfois appelé harvestingLe web scraping (parfois appelé harvesting) est une technique d'extraction du contenu de sites Web, via un script ou un programme, dans le but de le transformer pour permettre son utilisation dans un autre contexte comme l'enrichissement de bases de données, le référencement ou l'exploration de données.référencement ou l'exploration de données. , Web scraping (de l'anglès to scrap 'rasclaWeb scraping (de l'anglès to scrap 'rasclar') és una tècnica de programari o software informàtic per extreure informació dels llocs web. En general, aquest tipus de programes de software simulen l'exploració humana del World Wide Web, ja sigui amb la implementació de baix nivell de protocol de transferència d'hipertext (HTTP), o amb la incorporació d'un navegador web, com pot ser Internet Explorer o Mozilla Firefox. El web scraping està molt relacionat amb la indexació de la web, que indexa informació de la web utilitzant un robot. Aquesta tècnica és una tècnica universal adoptada per la majoria dels motors de cerca.Per contra, el web scraping se centra més en la transformació de les dades no estructurades al web, generalment en format HTML, en dades estructurades que poden ser emmagatzemaes estructurades que poden ser emmagatzema
rdfs:label 网页抓取 , Web scraping , تجريف ويب , Coleta de dados web , ウェブスクレイピング , Screen Scraping , Scrapen , Веб-скрейпинг
hide properties that link here 
http://dbpedia.org/resource/UBot_Studio + , http://dbpedia.org/resource/IMacros + , http://dbpedia.org/resource/Beautiful_Soup_%28HTML_parser%29 + , http://dbpedia.org/resource/Data_Toolbar + , http://dbpedia.org/resource/OutWit_Hub + http://dbpedia.org/ontology/genre
http://dbpedia.org/resource/Diffbot + http://dbpedia.org/ontology/service
http://dbpedia.org/resource/Site_scraping + , http://dbpedia.org/resource/Web_scraper + , http://dbpedia.org/resource/Web_harvesting + , http://dbpedia.org/resource/Harvester_%28web%29 + , http://dbpedia.org/resource/Internet_scrape + , http://dbpedia.org/resource/Web_Harvesting + , http://dbpedia.org/resource/Web_scrapping + , http://dbpedia.org/resource/Web_harvest + , http://dbpedia.org/resource/Web_scrape + , http://dbpedia.org/resource/Web_scrapers + , http://dbpedia.org/resource/Webscraping + http://dbpedia.org/ontology/wikiPageRedirects
http://dbpedia.org/resource/Indian_Certificate_of_Secondary_Education + , http://dbpedia.org/resource/Kodi_%28software%29 + , http://dbpedia.org/resource/Regular_expression + , http://dbpedia.org/resource/Parler + , http://dbpedia.org/resource/Headless_browser + , http://dbpedia.org/resource/Hiroyuki_Nishimura + , http://dbpedia.org/resource/Oxylabs + , http://dbpedia.org/resource/BitClout + , http://dbpedia.org/resource/Vaccine_Hunters_Canada + , http://dbpedia.org/resource/Search_analytics + , http://dbpedia.org/resource/Web_data_integration + , http://dbpedia.org/resource/ProZ.com + , http://dbpedia.org/resource/Email-address_harvesting + , http://dbpedia.org/resource/Python_%28programming_language%29 + , http://dbpedia.org/resource/IMDb + , http://dbpedia.org/resource/Privacy_concerns_regarding_Google + , http://dbpedia.org/resource/Mirror_site + , http://dbpedia.org/resource/QuickCode + , http://dbpedia.org/resource/AI_Dungeon + , http://dbpedia.org/resource/Wrapper_%28data_mining%29 + , http://dbpedia.org/resource/List_of_SIMILE_projects + , http://dbpedia.org/resource/Site_scraping + , http://dbpedia.org/resource/SQL_injection + , http://dbpedia.org/resource/List_of_online_music_databases + , http://dbpedia.org/resource/Ruzzo%E2%80%93Tompa_algorithm + , http://dbpedia.org/resource/Harvard_Bridge + , http://dbpedia.org/resource/HiQ_Labs_v._LinkedIn + , http://dbpedia.org/resource/Social_media_optimization + , http://dbpedia.org/resource/TheyWorkForYou + , http://dbpedia.org/resource/Importer_%28computing%29 + , http://dbpedia.org/resource/UBot_Studio + , http://dbpedia.org/resource/Craigslist_Inc._v._3Taps_Inc. + , http://dbpedia.org/resource/Yahoo%21_SearchMonkey + , http://dbpedia.org/resource/Scrape + , http://dbpedia.org/resource/Grant_Shapps + , http://dbpedia.org/resource/IMacros + , http://dbpedia.org/resource/List_of_augmented_browsing_software + , http://dbpedia.org/resource/Aptana + , http://dbpedia.org/resource/Rate_limiting + , http://dbpedia.org/resource/Popular_Science_Predictions_Exchange + , http://dbpedia.org/resource/Organized_Crime_and_Corruption_Reporting_Project + , http://dbpedia.org/resource/Content_protection_network + , http://dbpedia.org/resource/Web_crawler + , http://dbpedia.org/resource/MusicBee + , http://dbpedia.org/resource/Webjay + , http://dbpedia.org/resource/Fusker + , http://dbpedia.org/resource/Invidious + , http://dbpedia.org/resource/Instart + , http://dbpedia.org/resource/Open_Syllabus_Project + , http://dbpedia.org/resource/Techmeme + , http://dbpedia.org/resource/DALL-E + , http://dbpedia.org/resource/WebFetch + , http://dbpedia.org/resource/Openclipart + , http://dbpedia.org/resource/Crisis_mapping + , http://dbpedia.org/resource/SpyFu + , http://dbpedia.org/resource/HtmlUnit + , http://dbpedia.org/resource/BibDesk + , http://dbpedia.org/resource/Pastebin.com + , http://dbpedia.org/resource/Scrapy + , http://dbpedia.org/resource/Harvest_%28disambiguation%29 + , http://dbpedia.org/resource/Beautiful_Soup_%28HTML_parser%29 + , http://dbpedia.org/resource/Metadata + , http://dbpedia.org/resource/Spamdexing + , http://dbpedia.org/resource/Information_extraction + , http://dbpedia.org/resource/Wiktionary + , http://dbpedia.org/resource/Hoan_Ton-That + , http://dbpedia.org/resource/Data_scraping + , http://dbpedia.org/resource/Scraper_site + , http://dbpedia.org/resource/Lynx_%28web_browser%29 + , http://dbpedia.org/resource/2channel + , http://dbpedia.org/resource/Bot_prevention + , http://dbpedia.org/resource/Grams_%28search%29 + , http://dbpedia.org/resource/ASP.NET_Web_Forms + , http://dbpedia.org/resource/Clearview_AI + , http://dbpedia.org/resource/Contact_scraping + , http://dbpedia.org/resource/Social_media_mining + , http://dbpedia.org/resource/Veropedia + , http://dbpedia.org/resource/Michael_Hanna_%28judge%29 + , http://dbpedia.org/resource/Google_Person_Finder + , http://dbpedia.org/resource/NewsDiffs + , http://dbpedia.org/resource/WSO2_Mashup_Server + , http://dbpedia.org/resource/Alternative_data_%28finance%29 + , http://dbpedia.org/resource/Search_engine_scraping + , http://dbpedia.org/resource/List_of_web_testing_tools + , http://dbpedia.org/resource/Data_Toolbar + , http://dbpedia.org/resource/OutWit_Hub + , http://dbpedia.org/resource/Anna_Ridler + , http://dbpedia.org/resource/PolyAnalyst + , http://dbpedia.org/resource/Data_mining + , http://dbpedia.org/resource/Computer_Fraud_and_Abuse_Act + , http://dbpedia.org/resource/Geni.com + , http://dbpedia.org/resource/Data_extraction + , http://dbpedia.org/resource/Mashup_%28web_application_hybrid%29 + , http://dbpedia.org/resource/Jsoup + , http://dbpedia.org/resource/Inside_Airbnb + , http://dbpedia.org/resource/Islamic_State_Hacking_Division + , http://dbpedia.org/resource/Web_scraper + , http://dbpedia.org/resource/Criticism_of_Facebook + , http://dbpedia.org/resource/Log4Shell + , http://dbpedia.org/resource/Google_Earth + , http://dbpedia.org/resource/Kiwicon + , http://dbpedia.org/resource/Diffbot + , http://dbpedia.org/resource/Product_feed + , http://dbpedia.org/resource/Daybees_Search + , http://dbpedia.org/resource/Web_harvesting + , http://dbpedia.org/resource/Harvester_%28web%29 + , http://dbpedia.org/resource/Internet_scrape + , http://dbpedia.org/resource/Web_Harvesting + , http://dbpedia.org/resource/Web_scrapping + , http://dbpedia.org/resource/Web_harvest + , http://dbpedia.org/resource/Web_scrape + , http://dbpedia.org/resource/Web_scrapers + , http://dbpedia.org/resource/Webscraping + , http://dbpedia.org/resource/Website_scraping + http://dbpedia.org/ontology/wikiPageWikiLink
http://dbpedia.org/resource/UBot_Studio + , http://dbpedia.org/resource/Data_Toolbar + , http://dbpedia.org/resource/OutWit_Hub + http://dbpedia.org/property/genre
http://en.wikipedia.org/wiki/Web_scraping + http://xmlns.com/foaf/0.1/primaryTopic
http://dbpedia.org/resource/Web_scraping + owl:sameAs
http://dbpedia.org/resource/Applications_of_artificial_intelligence + rdfs:seeAlso
 

 

Enter the name of the page to start semantic browsing from.