探討機器學習的各個面向,如安全性、一致性、公平性。以安全性來說,傳統機器學習會假設 training 和 testing 的 data distribution 相近,但這其實在整個 machine learning 的 pipe line 中,有很多是壞人可以去動手腳去攻擊的,譬如說他可以在 model training 的時候對你的 training data 加入一些資料(Ex. 後門),那你訓練出來的模型就會有奇怪的行為;又或者是在 testing 的時候對你的 testing data 做一些微小的擾動,也會讓 testing 的結果跟壞人想象的一樣。
這個雖然說是安全性,但我個人並不是 security 的 background 出身的,我看待這個議題會比較以 machine learning 的角度去看,為什麼 machine learning model 會有這樣的現象,為什麼只要稍微改動一點點,人不覺得有什麼差別,但是機器學習的模型就整個壞掉了。或是其實他學習到的東西和人真正想要他學習的東西是不太一樣的,要怎麼改正這個東西,這個是我覺得這個會是下一步 Machine learning 要提升能力的關鍵。
對,是偏機器學習。我並不是用機器學習去探討資安的問題,而是去探討機器學習本身的安全。
基本大二必修的數學課,有修過機器學習相關的課程(至少一門)會更好。
我不太喜歡直接 assign 題目,一般來講,我喜歡經過討論而慢慢找到合適的研究方向。因為「找到研究題目」本來就是做研究裡面很重要的一環。因此我們通常會先找到大方向,例如說公平性方面的,那我可能會先丟幾篇 Paper 給他,或是也許之前會有一些我想過可能可以的題目(如:安全性裡面潛在的問題、可以用其他的東西做結合的部分⋯⋯),但我還沒有深入的探討,那就可以請他去研究看看,看怎麼解決這些問題這樣。
一開始會做滿多 literature survey ,因為一開始的方向都是滿大的,那慢慢的可能會想說:「這個地方可能可以做延伸」之類的,那我會給一些 feedback,逐漸修正之後就會找到一個比較具體的問題。
會啊,我們會有一些碩班學長畢業後做的還沒有很完整、還可以延伸下去做的方向。
我覺得滿難估計的。平均大概⋯⋯十個小時左右吧。
但我需要強調的是,時間可能不是最重要的。比較重要的應該是:第一個找對方向,接下來是看你有沒有積極。積極這個部分其實是看得出來的,像你有沒有積極的去看 paper,有一些想法之類的,可能就只是我交代什麼事情就做什麼事情。所以我覺得時間不會是最重要的,態度才是。
通常每個禮拜會有固定的 1v1 meeting,會聊一下這禮拜做了哪些事情、有什麼想法、看了哪些 paper⋯⋯,我會給一些 feedback 這樣。其他沒有硬性規定說要做哪些事情這樣。
可以寄信跟我約時間討論。
我覺得成績不是絕對的,畢竟有些必修跟我做的沒有很相關這樣。
(那如果是機率、線代⋯⋯之類的呢?)
分數其實有很多影響的因素,例如說:某個作業忘了繳、考試臨場發揮不好⋯⋯之類的,就是說成績不能代表一切。但是如果說你是有點擺爛,不是很想要把事情學好的話,那這個態度如果一樣用在做研究上,就會影響到研究的成果。
所以說「有沒有心把一件事情做好」會是比較重要的。我覺得以我們系上學生的聰明才智應該都沒有問題,就算之前修課沒有修的很好,但是之後有心想要把它學好、補好的話應該就沒問題。
我覺得可以多嘗試,像我本身之前在系上的時候,是大二下就加入實驗室做專題,大四的時候我又找了另一個老師,我的學生也有一些是同時找兩個老師做專題,這兩個專題的方向可能非常不一樣,甚至可能沒有什麼關係,那我覺得這也是一個「找到想做的方向」的一個方式。
就都去試試看,總有一個你目前看起來比較有興趣的方向,那就寄信問問看那個老師,看看有沒有專題研究的機會,就先做一個學期看看,如果覺得沒有很有興趣的話,就下學期再換一個。我覺得系上老師應該都會覺得沒什麼關係。
不負責宣言:MBTI 這個欄位僅供參考,主要是可能可以透過 MBTI 了解到老師的做事習慣、方式(可以自行上網搜尋),和自己的習慣做比較。
INFP