返回上一頁

對沖基金工作必須學習的 Python 軟件包

May 23, 2023 / 自我成長

正如我們之前在這裡所寫的,對沖基金喜歡會用 Python 編寫代碼的人。 Python 作為 Web 框架的領導者開始了生活,現已轉變為數據科學家的主要語言。對沖基金從數據中獲得了大量的阿爾法。

很少有人比量化對沖基金 Two Sigma 的董事總經理 Jeff Reback 更了解對沖基金的數據科學。 Reback 畢業於 MIT 計算機科學專業,自 2017 年以來一直在 Two Sigma 工作,是大數據和電子交易系統方面的專家。但有一件事 Reback 比什麼都清楚:Pandas,一個用於數據結構和數值表操作的開源 Python 庫。 Reback 是 Pandas 先生:他從 2013 年開始管理這個項目。

在幾個月前的一次網絡研討會上,Reback 展示了以下圖表,反映了自他接手以來 Python 庫中 Pandas 的巨大增長。根據 Stack overlow 上提出的問題,它反映了 Panda 在所有行業的數據包中的卓越地位,而不僅僅是在金融領域。

然而,自 2020 年以來,Panda 的增長已趨於平穩。這是因為 Pandas 很棒,但並非萬無一失。它很容易調試,也很容易測試,但是一旦數據超過 10 GB,它就不是很好了。在 10 GB 及以上,Pandas 效率較低且存在內存限制。

因此,在這一點上,Reback 說 Two Sigma 無縫切換到其他東西:Ibis,另一個為非常大的數據集設計的開源 Python 包。宜必思不在上面的圖表中。與 Pandas 一樣,Ibis 是由對沖基金 AQR 的前量化研究員 Wes McKinney 設計的。麥金尼本人詳細說明了 Panda 的所有缺陷以及他在 2017 年發明 Ibis 的原因。

因此,這些天來,您不僅需要了解 Pandas。你需要了解熊貓和宜必思。 Reback 說 Two Sigma 已經建立了一個技術棧“Bamboo”,它以 Pandas 為核心來處理較小的數據集,並使用 Ibis 將其代碼轉換為 Apache Spark 以處理更大的數據集。 “這非常棒,只需編寫一次代碼,測試它,讓它工作,然後完美地擴展它,”Reback 說。

目前,Pandas 是迄今為止使用最多的兩個庫:它在 Github 上有 35,000 顆星,而 Ibis 有 2,000 顆。但隨著數據的激增,宜必思就是未來。想要在對沖基金工作的數據科學家需要兩者都知道。

遇到問題嗎?