Wild Spider

web pages are crawled by being loaded into browser using multiple tabs parallelly

O que é Wild Spider?

Wild Spider é uma extensão do Chrome desenvolvida por Xuan Wu, e sua principal característica é "web pages are crawled by being loaded into browser using multiple tabs parallelly".

Capturas de Tela da Extensão

screenshot

Baixar o arquivo CRX da Extensão Wild Spider

Baixe arquivos de extensão Wild Spider no formato crx, instale manualmente as extensões do Chrome no navegador ou compartilhe os arquivos crx com amigos para instalar facilmente as extensões do Chrome.

Instruções de Uso da Extensão

                        WATCH OUT: more tabs you use, more computer resources (CPU, memory) will be used, and each page costs a bit disk to save the content (in IndexedDb, accessible from extensions -> Inspect views: background page).

The "spider" works in this way:
1) The current url is used as the starting point, and it's loaded again in a new tab.
2) After this page is loaded, fetch all the links on the page.
3) Get all the links on the page, including relative urls.
4) Open the extracted link parallelly in all the tabs used (by default 3, set in eventPage).
5) repeat 2-4

All source code at: https://github.com/nobodxbodon/ChromeCrawlerWildSpider                    

Informações Básicas da Extensão

Nome Wild Spider Wild Spider
ID aanpchnfojihjddlocpgoekffmjkhbbe
URL Oficial https://chromewebstore.google.com/detail/wild-spider/aanpchnfojihjddlocpgoekffmjkhbbe
Descrição web pages are crawled by being loaded into browser using multiple tabs parallelly
Tamanho do Arquivo 121 KB
Contagem de Instalações 44
Versão Atual 0.0.3
Última Atualização 2019-03-08
Data de Publicação 2019-03-08
Classificação 1.00/5 Total de 1 Avaliações
Desenvolvedor Xuan Wu
Tipo de Pagamento free
Site da Extensão https://github.com/nobodxbodon/ChromeCrawlerWildSpider
URL da Página de Ajuda https://github.com/nobodxbodon/ChromeCrawlerWildSpider/issues
Idiomas Suportados en-US
manifest.json
{
    "update_url": "https:\/\/clients2.google.com\/service\/update2\/crx",
    "name": "Wild Spider",
    "short_name": "demo web crawler that's still in experimenting",
    "description": "web pages are crawled by being loaded into browser using multiple tabs parallelly",
    "version": "0.0.3",
    "browser_action": {
        "default_icon": "icon.png"
    },
    "permissions": [
        "tabs",
        "activeTab",
        "webNavigation"
    ],
    "background": {
        "scripts": [
            "Dexie.js",
            "eventPage.js"
        ],
        "persistent": false
    },
    "content_scripts": [
        {
            "matches": [
                "*:\/\/*\/*"
            ],
            "js": [
                "htmlparser2.js",
                "content.js"
            ]
        }
    ],
    "manifest_version": 2
}