Wild Spider
web pages are crawled by being loaded into browser using multiple tabs parallelly
Wild Spiderとは何ですか?
Wild SpiderはXuan Wuによって開発されたChromeの拡張機能で、その主な機能は「web pages are crawled by being loaded into browser using multiple tabs parallelly」です。
拡張機能のスクリーンショット
Wild Spider拡張機能のCRXファイルをダウンロード
Wild Spider拡張子のファイルをcrx形式でダウンロードし、ブラウザにChrome拡張機能を手動でインストールするか、crxファイルを友達と共有して簡単にChrome拡張機能をインストールします。
拡張機能の使用方法
WATCH OUT: more tabs you use, more computer resources (CPU, memory) will be used, and each page costs a bit disk to save the content (in IndexedDb, accessible from extensions -> Inspect views: background page). The "spider" works in this way: 1) The current url is used as the starting point, and it's loaded again in a new tab. 2) After this page is loaded, fetch all the links on the page. 3) Get all the links on the page, including relative urls. 4) Open the extracted link parallelly in all the tabs used (by default 3, set in eventPage). 5) repeat 2-4 All source code at: https://github.com/nobodxbodon/ChromeCrawlerWildSpider
拡張機能の基本情報
名前 | Wild Spider |
ID | aanpchnfojihjddlocpgoekffmjkhbbe |
公式URL | https://chromewebstore.google.com/detail/wild-spider/aanpchnfojihjddlocpgoekffmjkhbbe |
説明 | web pages are crawled by being loaded into browser using multiple tabs parallelly |
ファイルサイズ | 121 KB |
インストール数 | 44 |
現在のバージョン | 0.0.3 |
最終更新日 | 2019-03-08 |
公開日 | 2019-03-08 |
評価 | 1.00/5 合計 1 レビュー |
開発者 | Xuan Wu |
支払い方法 | free |
拡張機能のウェブサイト | https://github.com/nobodxbodon/ChromeCrawlerWildSpider |
ヘルプページのURL | https://github.com/nobodxbodon/ChromeCrawlerWildSpider/issues |
対応言語 | en-US |
manifest.json | |
{ "update_url": "https:\/\/clients2.google.com\/service\/update2\/crx", "name": "Wild Spider", "short_name": "demo web crawler that's still in experimenting", "description": "web pages are crawled by being loaded into browser using multiple tabs parallelly", "version": "0.0.3", "browser_action": { "default_icon": "icon.png" }, "permissions": [ "tabs", "activeTab", "webNavigation" ], "background": { "scripts": [ "Dexie.js", "eventPage.js" ], "persistent": false }, "content_scripts": [ { "matches": [ "*:\/\/*\/*" ], "js": [ "htmlparser2.js", "content.js" ] } ], "manifest_version": 2 } |