Wild Spider

web pages are crawled by being loaded into browser using multiple tabs parallelly

Co je Wild Spider?

Wild Spider je rozšíření Chrome vyvinuté Xuan Wu, a jeho hlavní funkcí je „web pages are crawled by being loaded into browser using multiple tabs parallelly“.

Snímky obrazovky rozšíření

screenshot

Stáhnout soubor CRX rozšíření Wild Spider

Stáhněte si soubory rozšíření Wild Spider ve formátu crx, ručně nainstalujte rozšíření Chrome do prohlížeče nebo sdílejte soubory crx s přáteli, abyste jednoduše nainstalovali rozšíření Chrome.

Pokyny pro Použití Rozšíření

                        WATCH OUT: more tabs you use, more computer resources (CPU, memory) will be used, and each page costs a bit disk to save the content (in IndexedDb, accessible from extensions -> Inspect views: background page).

The "spider" works in this way:
1) The current url is used as the starting point, and it's loaded again in a new tab.
2) After this page is loaded, fetch all the links on the page.
3) Get all the links on the page, including relative urls.
4) Open the extracted link parallelly in all the tabs used (by default 3, set in eventPage).
5) repeat 2-4

All source code at: https://github.com/nobodxbodon/ChromeCrawlerWildSpider                    

Základní Informace o Rozšíření

Název Wild Spider Wild Spider
ID aanpchnfojihjddlocpgoekffmjkhbbe
Oficiální URL https://chromewebstore.google.com/detail/wild-spider/aanpchnfojihjddlocpgoekffmjkhbbe
Popis web pages are crawled by being loaded into browser using multiple tabs parallelly
Velikost souboru 121 KB
Počet instalací 44
Aktuální Verze 0.0.3
Poslední Aktualizace 2019-03-08
Datum Vydání 2019-03-08
Hodnocení 1.00/5 Celkem 1 Hodnocení
Vývojář Xuan Wu
Typ Platby free
Webové stránky Rozšíření https://github.com/nobodxbodon/ChromeCrawlerWildSpider
URL Stránky Nápovědy https://github.com/nobodxbodon/ChromeCrawlerWildSpider/issues
Podporované Jazyky en-US
manifest.json
{
    "update_url": "https:\/\/clients2.google.com\/service\/update2\/crx",
    "name": "Wild Spider",
    "short_name": "demo web crawler that's still in experimenting",
    "description": "web pages are crawled by being loaded into browser using multiple tabs parallelly",
    "version": "0.0.3",
    "browser_action": {
        "default_icon": "icon.png"
    },
    "permissions": [
        "tabs",
        "activeTab",
        "webNavigation"
    ],
    "background": {
        "scripts": [
            "Dexie.js",
            "eventPage.js"
        ],
        "persistent": false
    },
    "content_scripts": [
        {
            "matches": [
                "*:\/\/*\/*"
            ],
            "js": [
                "htmlparser2.js",
                "content.js"
            ]
        }
    ],
    "manifest_version": 2
}