|
||||
羊城晚報記者樑爽
中山大學軟件學院的學生研究出一款智能社交工具,自稱“微博界的007”,可以在新浪微博上挖出你的“八卦”料,讀者諸君你信嗎?記者懷着好奇心,上網一探究竟!這個名叫“中大八卦”的新浪微博賬號,雖僅發了5條微博,卻“出手不凡”,能精準分析任意微博用戶的喜好、密友等個人信息,能知道你的“八卦”材料!連這款智能工具的推廣者都驚歎:“專業的數據挖掘和語義分析已經可以做到令人生畏的地步了!”
有網友質疑,如此利用公開信息進行二次處理和使用是否侵犯隱私權?有專家認爲,收集、整理並使用網絡上碎片化的公開信息,並不存在侵犯隱私權的情況。
現象
“八卦君”鐵嘴神算“躺槍君”當場淚奔
“××同學,八卦君沒能從你的微博裏分析出你的名字,但是你應該是博濟工作室的,來自中山大學醫學院,你喜歡瀏覽果殼網,崇尚養生學,對犯罪心理略有興趣,你是一個80後,你的女生緣比男生緣好,粉絲中女性佔多數。有人告訴八卦君,(你是)喜歡站廁所裏哼香飄飄的猥瑣男,也有人說你是一個好人。”
以上微博由新浪微博@中大八卦所發,自稱“八卦君”的@中大八卦還邀請這位網友的4位“閨蜜”前來評論。雖然微博中並未涉及特別的隱私,但依然讓該網友和他的朋友們感到震驚。“求別這樣!”這位被“八卦”的網友在評論中發了多個流淚的表情,“我已經莫名其妙了……怎麼能隨意@這麼多人呢!”
在簡介中可以瞭解到,“中大八卦”是中山大學軟件學院學生做的一款基於新浪微博平臺進行數據挖掘的社交工具,目前尚在完善中。將騰訊微信賬號“—找小七”添加爲好友後,輸入任意新浪微博網友名稱,你便可以檢索出這個網友的喜好、密友、八卦等關鍵詞列表;若你願意,可以匿名將這位網友的關鍵詞列表分享到新浪微博@—找小八上去;部分“熱門”網友的趣味信息則會被髮到@中大八卦中,這些語義通順的趣味信息完全由機器人自動生成。
解密
如何通過微博信息分析你的個性特徵
如果某個人發微博說“今天的話劇真好看”,我們能否推測他是話劇愛好者,或者剛剛看完一場話劇?
如果能從微博公開信息中推測出一個網友的班級、職業等基本信息,那麼是否能推測出他所在的圈子,以及這個圈子中的其他人?
@中大八卦的微博管理員、中山大學資訊管理學院的大二學生小高向記者提出以上問題。“‘中大八卦’是中山大學軟件學院的一個數據挖掘和語義分析技術科研項目中開發的小應用,科研項目負責人是軟院副教授徐亞波,這個應用的目的是通過軟件快速瞭解一個人。”小高告訴記者,“人”的信息具有很高價值,“如果你參加面試,可以通過軟件查出老闆的微博賬號、性格、愛好;如果你想追求一個妹子,知道一點點信息就可以‘八’出她全部資料;未來有了‘圈子’功能,商家可以用它直接進行營銷。”
不需要臥底、不需要黑客,所有的推測均來源於新浪微博上的公開信息,所使用的技術叫做“數據挖掘”。
“數據挖掘讓人與人之間變得透明。”小高說。
據小高介紹,這款智能八卦軟件在微信上線兩個月,正式推廣一個多星期,目前有1400多名用戶,已完成8000—10000次搜索任務。平均每個用戶會“八卦”5—8人。1400多名用戶中僅有10個人反饋稱搜索不準確。
質疑
微博私信也被分析網友顧慮隱私遭侵
使用並分析網友的微博,需要申請新浪微博的授權,不論是微博正文、好友列表還是私信內容,都是可以公開分析的。
“包括地理位置、你在某個頁面停留的時間、你點擊的鏈接,我們都可以看到。你在網絡上的一切信息,都要做好公開的心理準備。”小高說。
雖然系統後臺每次檢索都會生成一段較爲精準的綜合性文字,但爲了保護隱私,系統一般只提供“喜好”、“密友”和“八卦”三個關鍵詞列表。截止到記者發稿時,只有4名網友的整體描述被公開在@中大八卦上。據小高介紹,這是爲了測試網友反應。他們的顧慮是對的,第一位被公開“八卦”的網友就在評論中表達了質疑:“這樣把別人的東西放出來,不好吧?”
“我們既要感慨技術的強大,也要思考一下倫理和法律問題。用戶是否覺得被侵犯了隱私?侵權的界限在哪裏?”小高在探索,“最大的疑問在於,如果用戶本身並沒有在微博上公開自己是中大的學生,也不願意公開,但我們系統分析並公佈出來了,這裏是否有問題?”
聲音
挖掘公開碎片信息不存在侵犯隱私權
網絡公開信息的二次處理和使用是否侵犯隱私權?記者採訪了中山大學法學院副教授張民安,他認爲這收集、整理並使用網絡上碎片化的公開信息,並不存在侵犯隱私權的情況。
他表示,如果一個人自願把自己的信息在微博上公開,那麼這條信息已經自動進入公共領域,不算隱私。既然已經公開,其他人便可以使用這些信息。“微博是對社會公衆開放的,至少對某些人開放。既然你願意將很隱祕的信息公開,那就表明你願意承擔風險,不能對公開的信息抱有隱私期待。新浪如何使用這些信息,都是沒有問題的。”張民安說。
張民安說,用戶若能在授權前特別約定“只授權給新浪使用”,授權時儘量對信息的使用目的和使用期限有一個清晰的約定,那麼,如果新浪使用信息過程中違反此約定,就可能構成侵權。否則,在一開始授權時沒有特別說明,新浪便默認你允許他使用信息。
“在信息社會,單個的個體信息價值很小,但如果經過加工、整合,形成一個數據庫,就有極高的價值,特別是對於商家。”張民安說,“個人信息被侵權也可能只是上百萬條信息中的一個,很難證明自己在精神和財產上有損害,起訴的成本很高,勝訴的希望很小。目前很難通過侵權法、民法來界定此類侵權,必須動用刑法、行政法來重新界定,纔能有效約束非法加工、非法出賣信息的人。”
同時,張民安認爲,很多商家大批量收集網絡上支離破碎的信息並進行處理,並非針對個人,因此網友大可不必恐慌。“信息社會其實就是個體和商人之間的互動過程。個體通過各種途徑拼命向社會公開信息,商人和機構通過各種途徑拼命收集你的信息,然後加工整理信息,形成信息資產。”
樑爽