Python大數(shù)據(jù)培訓(xùn)：通過read_csv()函數(shù)讀取CSV文件的數(shù)據(jù)

更新時(shí)間:2022-11-02 來源:黑馬程序員瀏覽量:

IT培訓(xùn)班

　　read_csv()函數(shù)的作用是將CSV文件的數(shù)據(jù)讀取出來，并轉(zhuǎn)換成DataFrame對(duì)象。read_csv()函數(shù)的語法格式如下。

read_csv(filepath_or_buffer,sep=',', delimiter=None,
         header='infer', names=None, index_col=None, usecols=None,
         squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None ...)

　　上述函數(shù)中常用參數(shù)表示的含義如下：

　　(1)file_or_buffer：表示文件路徑，可以為URL字符串。

　　(2)sep：指定使用的分隔符，如果不指定默認(rèn)用“，”分隔。

　　(3)header：指定行數(shù)用來作為列名，如果讀取的文件中沒有列名，則默認(rèn)為0，否則設(shè)置為None。

　　(4)names：用于結(jié)果的列名列表。如果文件不包含標(biāo)題行，則應(yīng)該將該參數(shù)設(shè)置為None。

　　(5)index_col：用作行索引的列編號(hào)或者列名，如果給定一個(gè)序列，則表示有多個(gè)行索引。

　　需要注意的是，在讀取文件時(shí)，如果傳入的是文件的路徑，而不是文件名，則會(huì)出現(xiàn)報(bào)錯(cuò)，具體的解決方法是先切換到該文件的目錄下，使用os模塊獲取該文件的文件名。

　　接下來，使用read_csv()函數(shù)將存儲(chǔ)在E盤目錄下“itcast.csv”文件的內(nèi)容讀取出來，示例代碼如下。

In [81]: import pandas as pd
         file = open(r'E:\數(shù)據(jù)分析\itcast.csv')
         # 讀取指定目錄下的csv格式的文件
         file_data=pd.read_csv(file)
         file_data
Out[81]:
            one_name  two_name
    0             1          4
    1             2          5
    2             3          6

　　Text格式的文件也是比較常見的存儲(chǔ)數(shù)據(jù)的方式，擴(kuò)展名為“.txt”，它與上面提到的CSV文件都屬于文本文件。如果希望讀取Text文件，既可以用前面提到的read_csv()函數(shù)，也可以使用read_table()函數(shù)。

上一篇：什么是Linux系統(tǒng)內(nèi)核？什么是Linux發(fā)行版？ 下一篇：數(shù)據(jù)分析工具Pandas：reindex()重置索引的方式