Wild Spider

web pages are crawled by being loaded into browser using multiple tabs parallelly

Was ist Wild Spider?

Wild Spider ist eine Chrome-Erweiterung, die von Xuan Wu entwickelt wurde, und ihr Hauptmerkmal ist "web pages are crawled by being loaded into browser using multiple tabs parallelly".

Erweiterungsscreenshots

screenshot

Wild Spider-Erweiterungs-CRX-Datei herunterladen

Laden Sie Wild Spider-Erweiterungsdateien im crx-Format herunter, installieren Sie Chrome-Erweiterungen manuell im Browser oder teilen Sie die crx-Dateien mit Freunden, um Chrome-Erweiterungen einfach zu installieren.

Anleitung zur Verwendung der Erweiterung

                        WATCH OUT: more tabs you use, more computer resources (CPU, memory) will be used, and each page costs a bit disk to save the content (in IndexedDb, accessible from extensions -> Inspect views: background page).

The "spider" works in this way:
1) The current url is used as the starting point, and it's loaded again in a new tab.
2) After this page is loaded, fetch all the links on the page.
3) Get all the links on the page, including relative urls.
4) Open the extracted link parallelly in all the tabs used (by default 3, set in eventPage).
5) repeat 2-4

All source code at: https://github.com/nobodxbodon/ChromeCrawlerWildSpider                    

Grundlegende Informationen zur Erweiterung

Name Wild Spider Wild Spider
ID aanpchnfojihjddlocpgoekffmjkhbbe
Offizielle URL https://chromewebstore.google.com/detail/wild-spider/aanpchnfojihjddlocpgoekffmjkhbbe
Beschreibung web pages are crawled by being loaded into browser using multiple tabs parallelly
Dateigröße 121 KB
Installationsanzahl 44
Aktuelle Version 0.0.3
Letztes Update 2019-03-08
Veröffentlichungsdatum 2019-03-08
Bewertung 1.00/5 Insgesamt 1 Bewertungen
Entwickler Xuan Wu
Zahlungsart free
Erweiterungswebsite https://github.com/nobodxbodon/ChromeCrawlerWildSpider
Hilfeseite URL https://github.com/nobodxbodon/ChromeCrawlerWildSpider/issues
Unterstützte Sprachen en-US
manifest.json
{
    "update_url": "https:\/\/clients2.google.com\/service\/update2\/crx",
    "name": "Wild Spider",
    "short_name": "demo web crawler that's still in experimenting",
    "description": "web pages are crawled by being loaded into browser using multiple tabs parallelly",
    "version": "0.0.3",
    "browser_action": {
        "default_icon": "icon.png"
    },
    "permissions": [
        "tabs",
        "activeTab",
        "webNavigation"
    ],
    "background": {
        "scripts": [
            "Dexie.js",
            "eventPage.js"
        ],
        "persistent": false
    },
    "content_scripts": [
        {
            "matches": [
                "*:\/\/*\/*"
            ],
            "js": [
                "htmlparser2.js",
                "content.js"
            ]
        }
    ],
    "manifest_version": 2
}