Wild Spider

web pages are crawled by being loaded into browser using multiple tabs parallelly

Wild Spider là gì?

Wild Spider là một tiện ích mở rộng Chrome được phát triển bởi Xuan Wu, và tính năng chính của nó là "web pages are crawled by being loaded into browser using multiple tabs parallelly".

Ảnh Chụp Màn Hình của Tiện Ích Mở Rộng

screenshot

Tải xuống tệp CRX của tiện ích mở rộng Wild Spider

Tải xuống các tệp mở rộng Wild Spider dưới định dạng crx, cài đặt các tiện ích mở rộng Chrome bằng tay trong trình duyệt hoặc chia sẻ các tệp crx với bạn bè để dễ dàng cài đặt các tiện ích mở rộng Chrome.

Hướng Dẫn Sử Dụng Tiện Ích Mở Rộng

                        WATCH OUT: more tabs you use, more computer resources (CPU, memory) will be used, and each page costs a bit disk to save the content (in IndexedDb, accessible from extensions -> Inspect views: background page).

The "spider" works in this way:
1) The current url is used as the starting point, and it's loaded again in a new tab.
2) After this page is loaded, fetch all the links on the page.
3) Get all the links on the page, including relative urls.
4) Open the extracted link parallelly in all the tabs used (by default 3, set in eventPage).
5) repeat 2-4

All source code at: https://github.com/nobodxbodon/ChromeCrawlerWildSpider                    

Thông Tin Cơ Bản về Tiện Ích Mở Rộng

Tên Wild Spider Wild Spider
ID aanpchnfojihjddlocpgoekffmjkhbbe
URL Chính Thức https://chromewebstore.google.com/detail/wild-spider/aanpchnfojihjddlocpgoekffmjkhbbe
Mô tả web pages are crawled by being loaded into browser using multiple tabs parallelly
Kích Thước Tệp 121 KB
Số Lần Cài Đặt 44
Phiên Bản Hiện Tại 0.0.3
Cập Nhật Lần Cuối 2019-03-08
Ngày Phát Hành 2019-03-08
Đánh Giá 1.00/5 Tổng số 1 Đánh Giá
Nhà Phát Triển Xuan Wu
Loại Thanh Toán free
Trang Web Mở Rộng https://github.com/nobodxbodon/ChromeCrawlerWildSpider
URL Trang Trợ Giúp https://github.com/nobodxbodon/ChromeCrawlerWildSpider/issues
Ngôn Ngữ Được Hỗ Trợ en-US
manifest.json
{
    "update_url": "https:\/\/clients2.google.com\/service\/update2\/crx",
    "name": "Wild Spider",
    "short_name": "demo web crawler that's still in experimenting",
    "description": "web pages are crawled by being loaded into browser using multiple tabs parallelly",
    "version": "0.0.3",
    "browser_action": {
        "default_icon": "icon.png"
    },
    "permissions": [
        "tabs",
        "activeTab",
        "webNavigation"
    ],
    "background": {
        "scripts": [
            "Dexie.js",
            "eventPage.js"
        ],
        "persistent": false
    },
    "content_scripts": [
        {
            "matches": [
                "*:\/\/*\/*"
            ],
            "js": [
                "htmlparser2.js",
                "content.js"
            ]
        }
    ],
    "manifest_version": 2
}