頭條主網上線在...

主網上線在即,AI 數據的分佈式存儲協議EpiK 如何變垃圾數據為有效數據? – 鏈聞ChainNews

EpiK Protocol 集數據標註、分佈式存儲以及數據應用等功能於一身,嘗試解決市場缺乏有效數據的問題。

撰文:Zeo Zhang

騰訊創始人馬化騰曾在2017 年「邁進智能新時代」中國(深圳) IT 領袖峰會上坦言:

目前很多大數據是垃圾數據,因為沒有標籤,用再好的算法也算不出來,數據清洗、標籤化難度非常高,我們甚至要耗費很多人工先清洗數據,再讓AI 學習。

一席話道出人工智能發展難點。在互聯網計算機迭代數十年後,算法和算力的積累已將人工智能推向一個新的階段,但缺乏高質量的有效數據,成為掣肘人工智能發展的重要原因之一。在解決這一問題上,測試網已經平穩運行一年的AI 數據的分佈式存儲協議EpiK Protocol 提出了結合區塊鏈的解決方案。

2021 年8 月15 日,測試網已經平穩運行一年的AI 數據的分佈式存儲協議EpiK Protocol 將正式上線主網。作為一個首次集數據標註、分佈式存儲以及數據應用等功能於一身的項目,EpiK Protocol 嘗試解決市場缺乏有效數據問題,構建共建共享共益的AI 數據的分佈式存儲協議?

image (1).png

為什麼缺乏有效數據?

一方面,平台默許甚至鼓勵虛假的刷數據行為,造成無用數據橫行。

對於傳統互聯網行業來說,刷數據現象司空見慣:新開的網店九成以上會選擇刷單吸引客流量;即使是訂閱量超百萬的微信大號也經常通過刷閱讀量滿足廣告客戶的數據需求;更甚者,某旅遊平台曾被爆出通過機器+人工的形式,冒充用戶發表了數千萬的用戶評價,以假亂真,影響用戶對產品的真實測評。

對於一向標榜公開、透明、鏈上可追溯的區塊鏈行業來說,刷數據現象仍不鮮見,分佈式存儲領域明星項目Filecoin 也曾陷入「無效數據」質疑:在Filecoin 網絡剛上線時,較高的挖礦收益吸引大量礦工參與,甚至有部分礦工利用外部程序進行灌裝虛擬數據或自己封裝一些毫無價值的垃圾數據。 Filecoin 存儲算力快速暴增,從而導致存儲的數據量短時間爆增。再加上Filecoin 網絡一開始無法對存儲的數據進行分辨,真實有效數據極少,大量物理存儲被浪費,對整個Filecoin 生態發展帶來不良影響。

另一方面,數據處理成本居高不下,多數人工智能不堪重負。

眾所周知,人工智能需要不斷深度學習,這需要龐大的數據量支撐。

龐大的用戶群體每天活躍在互聯網中,產生龐雜的數據。然而這些數據並不能被直接使用。人工智能的深度學習需要數據集的獲得、數據的標註等,其中數據的標註會造成巨大的人力成本。廣泛應用深度學習網絡需要大量已標註的數據進行訓練才有可能達到預期的效果,但大數據時代下,雖然有海量的數據取之不盡,絕大部分卻是未進行標註的數據,這些訓練數據的標註需要人為進行。

對於數據品質要求越高,數據的標註需求就越精細,對標註人員的素質和專業知識的要求也就越高,相對應成本也越高。

長久以來,這些數據都由專門的數據標籤分類公司(比如Amazon Mechanical)進行加工處理,以供人工智能等數據需求領域發展使用。然而,用戶-數據處理公司-數據需求者的三方協作,使得有價值的數據獲取成本極高。

image (2).png

標註、存儲、銷售:EpiK Protocol 的一站式數據服務

EpiK Protocol 生態引入領域專家、賞金獵人、數據企業三類角色,致力於構建去中心化的大規模共建共享共益的AI 數據存儲協議,通過去中心化存儲技術IPFS、去中心化自治組織DAO 及通證經濟模型,組織並激勵全球社區成員將人類各領域知識梳理成可用的AI 數據,並持續更新這一人類永恆知識庫。

在數據標註方面,EpiK Protocol 連接C 端用戶推出AI 數據標註系統。

「領域專家」設計不同領域的AI 數據格式,並發布數據標註任務;人人都能註冊成為「賞金獵人」,參與數據標註成為AI 老師,獲得EPK 代幣獎勵。

完成數據標註後,「賞金獵人」返還處理過的數據,「領域專家」驗收所負責領域AI 數據獲得EPK 代幣獎勵。此外,「領域專家」還會根據數據結果優化AI 數據格式,良性循環下,數據質量得到不斷提升。

image (3).png

在數據存儲方面,EpiK Protocol 推出AI 數據存儲系統。

完成標註並通過驗收的數據將由「領域專家」上傳至AI 數據存儲系統進行分佈式存儲,參與數據存儲的設備也都可以獲得EPK 代幣獎勵。

在數據銷售方面,數據企業可通過質押EPK 來訪問數據,並從AI 數據存儲系統中付費下載有效數據。

由於EpiK Protocol 的AI 數據標註系統直接面向C 端用戶,消除了中間戶數據標註公司的存在,簡化了數據處理流轉的各個環節,因此成本更低。以一條可用的AI 語音方言數據為例:傳統市場一條可用數據成本約在12 元左右,而在EpiK Protocol 系統成本約為2 元,是傳統市場的1/6。

更重要的是,由於EpiK Protocol 系統中有來自各行各業的「領域專家」把關數據治理,因此EpiK Protocol 系統產生的有效數據更能夠精準符合不同AI 領域的數據需求。

image (4).png

協同B 端、C 端和行業專家的開放經濟模式

不同於目前分佈式存儲主要圍繞B 端歸檔數據存儲服務的商業模式,EpiK Protocol 是一個協同B 端企業、C 端用戶和領域專家的去中心化協同AI 數據存儲協議,在成本控制、收益提升和服務體驗方面,都具有媲美中心化互聯網巨頭的能力。

C 端用戶:更低的數據標註門檻

EpiK Protocol 針對C 端用戶打造了AI 數據採集應用「知識大陸」,降低了數據標註門檻,同時提升了趣味性。卡通的界面和簡明的佈局讓數據標註這種枯燥而繁雜的工作變為有趣的遊戲,通過遊戲化形式組織其全球社區成員共建大規模開放AI 數據庫。

image (5).png

各行各業都可以在「知識大陸」中創建AI 數據類型,包括金融、醫藥、法律、社交、電商等,未來隨著知識大陸的發展和運用,有數據需求的公司都可以選擇在此進行共同協作收集整理並處理數據。

其次,EpiK Protocol 的標註效率更高。 AI 數據標註系統運營三週以來,EpiK Protocol 標註了17272 條有效數據,且數據指標完整,每條數據被人工驗證次數高達10 次。相比較於傳統標註方式,EpiK Protocol 的標註效率高了近乎10 倍。

image (6).png

最重要的是,參與EpiK Protocol 數據標註的用戶能夠獲得更高收益。傳統數據標註模式中,數據處理者僅作為一種人工勞動力,並不享有數據分紅權。而在EpiK Protocol 中,對數據做出貢獻所獲得的EPK 實際是獲得了數據的股權,分享數據在後續使用過程中的盈利分紅。後期數據需求越大,EPK 需求就越高,EPK 便會升值,EPK 持有者便可以獲益。

B 端用戶:激勵有效數據

EpiK Protocol AI 數據存儲系統採取經典的1 + 3 配置,即1 Deamon + 3 Miners (8 核16G,250G SSD,3T HDD,15M 帶寬)配置。與Filecoin 相比,EpiK Protocol AI 數據存儲系統參與出塊最小算力為0、存儲免費,無需指定節點且默認無限份數、無限時間,更能夠充分調度起每台閒置存儲設備。

最重要的是,Filecoin 存儲無用數據也可獲得算力,但EpiK Protocol 存儲系統中只有通過「領域專家」驗證過的數據才可獲得算力,這不僅保障了數據的高質量,而且進一步遏制了無效數據浪費存儲空間的不良影響。

項目團隊

EpiK Protocol 擁有行業頂級顧問以及實力派投資機構。著名AI 科學家、SigularityNET 創始人、全球首個機器人公民Sophia 之父的首席科學家Ben Goertzel 出任EPIK 銘識協議顧問,協助EPIK 推動歐美數據市場,助力構建高質量的AI 數據生態。

主網上線在即,AI 數據的分佈式存儲協議EpiK 如何變垃圾數據為有效數據?

融資方面,EpiK Protocol 獲得了包括FBG Capital、JACKDAW、1475、ChainUp Capital、7 O’clock Capital 等機構的青睞,助力AI 數據的分佈式存儲以新的勢頭進入大眾視野。

主網即將上線

根據團隊最新消息,EpiK「主網1.0 羅塞塔」將於2021 年8 月15 日中午12 點正式上線。該時間也是EpiK 測試網上線1 週年的時刻。目前測試網5.0 在測節點已超過6 萬個,穩定出塊。

隨著主網的日益臨近,挖頭礦也成為EpiK Protocol 用戶的關注焦點之一。作為EpiK Protocol 生態激勵代幣,EPK 總發行量為10 億,其具體分配規則如下:

  • 創世團隊:5%,每90 天釋放1/16;
  • 基金會:5%,每90 天釋放1/4;
  • 投資人:20%,每90 天釋放1/7;
  • 社區:70%,出塊速遞每90 天衰減一次,4 年減半,分50 年釋放完畢。

image (7).png

EpiK Protocol 擁有AI 數據標註和AI 數據存儲兩大系統,也對應了兩種主要參與方式:

第一類,參與標註AI 數據,成為EPK 賞金獵人。利用閒暇時間參與標註不同AI 領域數據,完成任務越多,EPK 收益越高。認真答題還有機會贏取知識徽章NFT,後續可憑藉NFT 參與EPK 空投活動。

第二類,參與存儲AI 數據,成為EPK 存儲節點。利用閒置的存儲設備即可參與存儲AI 有效數據,每個存儲節點需要完成1000 EPK 的基礎質押才能擁有出塊權。存儲節點是隨機獲得出塊機會的,但是其隨機被選中的概率和其成功存儲的數據大小掛鉤:存的數據越多,被選中概率越高,同一個文件的Top100 存儲者享有雙倍算力。

只有通過領域專家驗證過的數據才被計為有效存儲,存儲節點才能獲得算力,因此,為了獲取更多的有效存儲,就需要完成額外的流量抵押。 1 EPK 可以用於訪問10 Mib 數據,也可用於封裝10 Mib 數據。目前,基礎抵押提現的解鎖期為0 天,流量抵押提現的解鎖期為3 天。

結語

EpiK Protocol 還開啟了在分佈式治理領域的探索,於7 月20 日發布了EpiK DAO。作為分佈式存儲賽道首個DAO 治理模型,社區用戶可以藉助EpiK DAO 參與EpiK 生態資源的動態調節,有效保障EpiK 社區的可持續發展,修復未來可能發生的資源錯配問題。

隨著Web 3.0 時代的日益來臨,數據的重要性日益凸顯。 EpiK Protocol 從數據標註到數據分佈式存儲再到對接企業實現數據應用,打造了一個低門檻、高效率的數據收益共享閉環,未來EpiK Protocol 如何實現豐富的落地應用場景值得期待。

.

Source Link

最受歡迎

繼續閱讀

長期持有者持有的比特幣(BTC)供應量達到最高水平

根據Glassnode 的估計,比特幣的長期持有者(LTH)目前擁有1452 萬枚BTC,創歷史新高,只剩下25% 留給短期持...

抓住Web3 遊戲的先發優勢:成功策略

Web3和區塊鏈技術的出現徹底改變了遊戲行業,為開發者和企業家提供了前所未有的機遇。 Web3 遊戲的去中心化性質為創新遊戲貨幣化模式、玩家所有權和社區參與打...

現在讀

$COOKIE, the Cookie3 Mark...

Tallinn, Estonia, March 26th, 2024...

長期持有者持有的比特幣(BTC)供應量達到最高水平...

根據Glassnode 的估計,比特幣的長期持有者(LTH)目前擁有1452 萬枚BTC,創歷史新高,只剩下25% 留給短期持有者和投機者。 儘管BTC 的價格在過去一個月中保持相對平穩,範圍在約29,000 美元至31,000 美元之間,但人們還是開始瘋狂囤積。 ...

Caldera 宣布與Espresso Syste...

Caldera 開發人員可以利用Espresso Sequence...

抓住Web3 遊戲的先發優勢:成功策略

Web3和區塊鏈技術的出現徹底改變了遊戲行業,為開發者和企業家提供了前所未有的機遇。 Web3 遊戲的去中心化性質為創新遊戲貨幣化模式、玩家所有權和社區參與打開了大門。對於那些尋求利用Web3 遊戲巨大潛力的人來說,確保先發優勢至關重要。 了解Web3 遊戲生態系統在深入研究Web3 遊戲之前,有...

Taapsee Pannu 推出NFT 平台,介紹...

企業家貢獻者表達的意見是他們自己的。 您正在閱讀《企業家印度》,這是企業家媒體的國際特許經營刊物。 女演員Taapsee Pannu 最近推出了“taapseeclub.com”,這是她自己的非同質代...

比特幣(BTC) 地址休眠超過11 年,轉移310...

經過11 年多的閒置之後,一個包含3100 萬美元BTC 的休眠比特幣地址最近突然活躍起來。 2023年7月22日,地址 轉入 將其全部餘額轉移到新地址。 早期BTC 地址復活 比特幣自2009 年以來就已經存在,因此存在多年來不活躍的休眠地址,其中包含大量BTC。這種加密貨幣的一些早期採用者能夠...

加密貨幣死了嗎?當今加密貨幣的現狀

您之前可能聽說過加密貨幣正在消亡(或比特幣已消亡)。在這篇文章中,我們將研究加密貨幣的狀態,並嘗試回答這個問題:加密貨幣現在已經死了嗎? 在我們開始之前,我們想澄清一下,本文指的是最廣泛意義上的“加密貨幣行業”; 在裡面 網絡3 感覺。該定義包括加密資產市場; 但它還包括其他非財務用例。 隨著近來加...

Chancer 可能成為體育和社交博彩領域的下一個...

加密貨幣 隨著企業財報季節的繼續,本週股市表現好壞參半。在Ne...

以太坊(ETH) 創下兩個月來CEX 流入最高紀錄...

過去一周,以太坊(ETH)流入中心化交易所(CEX)的資金量創下了過去兩個月來的最高水平。這些重大的資產變動表明ETH 的價格可能會下跌。 CoinGecko 數據顯示,第二大加密貨幣的價格一直在小幅下跌,過去一周價值下跌了2.5%。截至撰寫本文時,以太幣易手價格為1,892.65 美元,過去24...

新的DeFi 法案有“不可行的義務”

加密貨幣創新委員會表示,新的反洗錢法案沒有為DeFi 中的非法金融...

幣安大幅削減成本,瑞波幣為美國銀行和加密貨幣風險投...

美國證券交易委員會(SEC)對加密貨幣公司的打擊似乎嚴重影響了幣安的業務。據報導,在過去幾週內,該加密貨幣交易所解雇了1,000 多名員工,並削減了一些福利。 幣安表示,“當前的市場環境和監管環境”導致利潤下降,這表明可能正在進行更多削減。一位發言人告訴Cointelegraph,該公司將考慮縮減“...

Automata 雙週更新:第48 期| 通過自動...

迎接新的季度意味著設定我們的意圖並為團隊規劃下一步的行動。幕後醞釀的一切——合作、產品功能和營銷發布——很難抑制我們的興奮。我們一開始就在1RPC(2 個備受期待的第2 層主網)上添加了對Linea 和Base 的支持。科技載體更新頁腳以顯示界面版本平滑的用戶體驗 USDC CCTP 支持 關於仲裁...