跳至主要内容

數位足跡

· 閱讀時間約 7 分鐘

我下載了我從國小開始使用的 Google 帳戶中 YouTube 和 YouTube 使用紀錄,匯出之後看到要下載的內容覺得還蠻可怕的,光大小就足足有 43 GB,內容詳細紀錄了我在 YouTube 的一舉一動,並整理的井井有條!我覺得我已經不是很重度的 YouTube 使用者還有這多東西,每個人都這樣紀錄怪不得他有龐大的數據可以拿來改進演算法。

先說,紀錄不是什麼壞事,不然打開一些很久以前的影片留言或影片資訊欄說明會不見也蠻令人困擾的,但當這樣的紀錄整理好後真實的拿在手裡,就會覺得有點沈重了,能整理的這麼有條理才是讓我感到不舒服的,因為根據他們的使用條款,這絕對被拿來賣給廣告商和跑一些最佳化推薦的演算法。

YouTube 下載資料控制台

雖然這 43GB 大部分是我的頻道以前玩遊戲的手機螢幕錄製,以前的 iPhone 預設的螢幕錄影設定讓我每次錄製都產生超級大的檔案,直到我開始學計算機概論後才發現到這個問題。19 個檔案從第二包開始就都只有有影片(至少我目前下載了兩包都是這樣),但他提供的 CSV 還是有很多有意思的地方,讓我們一起來瞧瞧。

第一包壓縮檔內容

留言紀錄

首先是 comments 資料夾,裡面有所有我在各個影片留言區留言的內容,並紀錄了原始影片的擁有者、留言時間和超級留言打賞的價格,拆了一堆檔案是因為每個 csv 最多只放 200 個留言,大概是避免生成的時候把記憶體充爆。有這些資料可以幹嘛呢?就留言時間就可以畫月份、時間散佈圖,然後就會發現我在 2017 年前後比較常留言(國小生嘛,比較愛在網路上湊熱鬧),然後再看看頻道 ID 就可以分析是哪種影片,就知道我當時對妖怪手錶噗尼噗尼蠻熱衷的,留言都是在這些實況主的頻道,以後如果有曾經留言過的頻道主發布影片就可能有比較高的機率先出現在我的首頁,畢竟我還蠻死忠的。

YouTube Music

music (library and uploads) 這個資料夾東西和 csv 的條目有點少,加上我最近都用自架 Navidrome 聽音樂,沒看出來這是什麼的紀錄,還有一些我好像沒有聽過的歌曲,跳過這個。

影片中繼資料

我自己影片的資訊欄文字,還有一個檔案是放錄影的檔案的 EXIF 紀錄拍攝位置,我的影片不是有剪輯就是螢幕錄影,所有經緯度都是 0 ,我猜這個可能是直接上傳相機內容或是 YouTube 直播才會紀錄的東西。大部分的人不太會在 YouTube 直播,就算他紀錄你可能也不會在意,那來看看其他的例子:手機拍下來的圖片絕大部分都會有 EXIF ,如果你把這些檔案直接 PO 上 instergram 這些社群平台就相當於直接把拍攝位置資訊送給他,久了就可以形成一張活動網路,他就可以分析你喜歡在哪邊拍 reals、限時動態藉此推論你可能會在哪出沒,然後更符合需求的推送廣告。啊,也不用這麼麻煩,你有裝 App 就可以在後台偷看定位資訊了。

播放清單

收藏從未停止,行動從未開始。記得要整理才不會亂七八糟。

聊天室

和留言紀錄差不多的東西,只不過紀錄了我喜歡看哪些直播並和直播主互動頻率。

觀看紀錄

理論上有觀看紀錄和搜尋紀錄,通通跑不掉的。但我卻沒有看到觀看紀錄,覺得有點奇怪。

訂閱內容

一個紀錄頻道 ID 、網址和名稱的 csv ,這是我這次下載的這坨賽博足跡的主要目的,我要把訂閱內容放進 freeTube 和 YouTube 說掰掰。

頻道

這是我自己的頻道設定檔,包括橫幅連結、聊天室設定之類的,這沒有什麼。

最後一包-總覽

直接跳過中間的影片壓縮檔到最後一包壓縮檔,只有一個 html 檔案,寫了這次下載的內容和刪除這些紀錄的連結(還算他有良心),不過在刪除的過程它會千方百計阻止你,

summery

推薦你也可以去下載你的使用者資料,除了挖黑歷史,一口氣看到這麼多你自己的使用紀錄非常震撼。你在 YouTube 右上角的頭貼的選單可以進入下載頁面。

如何下載使用足跡

下載頁面