Wild Spider
web pages are crawled by being loaded into browser using multiple tabs parallelly
O que é Wild Spider?
Wild Spider é uma extensão do Chrome desenvolvida por Xuan Wu, e sua principal característica é "web pages are crawled by being loaded into browser using multiple tabs parallelly".
Capturas de Tela da Extensão
Baixar o arquivo CRX da Extensão Wild Spider
Baixe arquivos de extensão Wild Spider no formato crx, instale manualmente as extensões do Chrome no navegador ou compartilhe os arquivos crx com amigos para instalar facilmente as extensões do Chrome.
Instruções de Uso da Extensão
WATCH OUT: more tabs you use, more computer resources (CPU, memory) will be used, and each page costs a bit disk to save the content (in IndexedDb, accessible from extensions -> Inspect views: background page). The "spider" works in this way: 1) The current url is used as the starting point, and it's loaded again in a new tab. 2) After this page is loaded, fetch all the links on the page. 3) Get all the links on the page, including relative urls. 4) Open the extracted link parallelly in all the tabs used (by default 3, set in eventPage). 5) repeat 2-4 All source code at: https://github.com/nobodxbodon/ChromeCrawlerWildSpider
Informações Básicas da Extensão
Nome | Wild Spider |
ID | aanpchnfojihjddlocpgoekffmjkhbbe |
URL Oficial | https://chromewebstore.google.com/detail/wild-spider/aanpchnfojihjddlocpgoekffmjkhbbe |
Descrição | web pages are crawled by being loaded into browser using multiple tabs parallelly |
Tamanho do Arquivo | 121 KB |
Contagem de Instalações | 44 |
Versão Atual | 0.0.3 |
Última Atualização | 2019-03-08 |
Data de Publicação | 2019-03-08 |
Classificação | 1.00/5 Total de 1 Avaliações |
Desenvolvedor | Xuan Wu |
Tipo de Pagamento | free |
Site da Extensão | https://github.com/nobodxbodon/ChromeCrawlerWildSpider |
URL da Página de Ajuda | https://github.com/nobodxbodon/ChromeCrawlerWildSpider/issues |
Idiomas Suportados | en-US |
manifest.json | |
{ "update_url": "https:\/\/clients2.google.com\/service\/update2\/crx", "name": "Wild Spider", "short_name": "demo web crawler that's still in experimenting", "description": "web pages are crawled by being loaded into browser using multiple tabs parallelly", "version": "0.0.3", "browser_action": { "default_icon": "icon.png" }, "permissions": [ "tabs", "activeTab", "webNavigation" ], "background": { "scripts": [ "Dexie.js", "eventPage.js" ], "persistent": false }, "content_scripts": [ { "matches": [ "*:\/\/*\/*" ], "js": [ "htmlparser2.js", "content.js" ] } ], "manifest_version": 2 } |