更新時間:2022-11-02 來源:黑馬程序員 瀏覽量:
read_csv()函數的作用是將CSV文件的數據讀取出來,并轉換成DataFrame對象。read_csv()函數的語法格式如下。
read_csv(filepath_or_buffer,sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None ...)
上述函數中常用參數表示的含義如下:
(1)file_or_buffer:表示文件路徑,可以為URL字符串。
(2)sep:指定使用的分隔符,如果不指定默認用“,”分隔。
(3)header:指定行數用來作為列名,如果讀取的文件中沒有列名,則默認為0,否則設置為None。
(4)names:用于結果的列名列表。如果文件不包含標題行,則應該將該參數設置為None。
(5)index_col:用作行索引的列編號或者列名,如果給定一個序列,則表示有多個行索引。
需要注意的是,在讀取文件時,如果傳入的是文件的路徑,而不是文件名,則會出現報錯,具體的解決方法是先切換到該文件的目錄下,使用os模塊獲取該文件的文件名。
接下來,使用read_csv()函數將存儲在E盤目錄下“itcast.csv”文件的內容讀取出來,示例代碼如下。
In [81]: import pandas as pd file = open(r'E:\數據分析\itcast.csv') # 讀取指定目錄下的csv格式的文件 file_data=pd.read_csv(file) file_data Out[81]: one_name two_name 0 1 4 1 2 5 2 3 6
Text格式的文件也是比較常見的存儲數據的方式,擴展名為“.txt”,它與上面提到的CSV文件都屬于文本文件。如果希望讀取Text文件,既可以用前面提到的read_csv()函數,也可以使用read_table()函數。