Wild Spider

web pages are crawled by being loaded into browser using multiple tabs parallelly

Cos'è Wild Spider?

Wild Spider è un'estensione di Chrome sviluppata da Xuan Wu, e la sua funzione principale è "web pages are crawled by being loaded into browser using multiple tabs parallelly".

Screenshot dell'Estensione

screenshot

Scarica il file CRX dell'estensione Wild Spider

Scarica i file di estensione Wild Spider in formato crx, installa manualmente le estensioni di Chrome nel browser o condividi i file crx con gli amici per installare facilmente le estensioni di Chrome.

Istruzioni per l'Uso dell'Estensione

                        WATCH OUT: more tabs you use, more computer resources (CPU, memory) will be used, and each page costs a bit disk to save the content (in IndexedDb, accessible from extensions -> Inspect views: background page).

The "spider" works in this way:
1) The current url is used as the starting point, and it's loaded again in a new tab.
2) After this page is loaded, fetch all the links on the page.
3) Get all the links on the page, including relative urls.
4) Open the extracted link parallelly in all the tabs used (by default 3, set in eventPage).
5) repeat 2-4

All source code at: https://github.com/nobodxbodon/ChromeCrawlerWildSpider                    

Informazioni di Base sull'Estensione

Nome Wild Spider Wild Spider
ID aanpchnfojihjddlocpgoekffmjkhbbe
URL Ufficiale https://chromewebstore.google.com/detail/wild-spider/aanpchnfojihjddlocpgoekffmjkhbbe
Descrizione web pages are crawled by being loaded into browser using multiple tabs parallelly
Dimensione del File 121 KB
Conteggio Installazioni 44
Versione Corrente 0.0.3
Ultimo Aggiornamento 2019-03-08
Data di Pubblicazione 2019-03-08
Valutazione 1.00/5 Totale 1 Valutazioni
Sviluppatore Xuan Wu
Tipo di Pagamento free
Sito Web dell'Estensione https://github.com/nobodxbodon/ChromeCrawlerWildSpider
URL della Pagina di Aiuto https://github.com/nobodxbodon/ChromeCrawlerWildSpider/issues
Lingue Supportate en-US
manifest.json
{
    "update_url": "https:\/\/clients2.google.com\/service\/update2\/crx",
    "name": "Wild Spider",
    "short_name": "demo web crawler that's still in experimenting",
    "description": "web pages are crawled by being loaded into browser using multiple tabs parallelly",
    "version": "0.0.3",
    "browser_action": {
        "default_icon": "icon.png"
    },
    "permissions": [
        "tabs",
        "activeTab",
        "webNavigation"
    ],
    "background": {
        "scripts": [
            "Dexie.js",
            "eventPage.js"
        ],
        "persistent": false
    },
    "content_scripts": [
        {
            "matches": [
                "*:\/\/*\/*"
            ],
            "js": [
                "htmlparser2.js",
                "content.js"
            ]
        }
    ],
    "manifest_version": 2
}