R语言学习笔记11-读取csv-xlsx-txt-json-pdf-lua格式文件

6,208次阅读
没有评论

共计 2117 个字符,预计需要花费 6 分钟才能阅读完成。

R 语言学习笔记 11- 读取 csv-xlsx-txt-json-pdf-lua 格式文件

  • 读取 csv
    • 使用 base 的 read.csv 函数
    • 使用 readr 包的 read_csv 函数
  • 读取 xlsx
    • 使用 xlsx 包的 read.xlsx 函数
    • 使用 readxl 包的 read_excel 函数
  • 读取 txt
    • 使用 base 的文件读取函数 readLines
    • 使用 readr 包的 read_lines 函数
  • 读取 json
    • 使用 jsonlite 包读取 JSON 文件
  • 读取 pdf
    • 使用 pdftools 包读取 pdf 文件
  • 读取 lua
    • 使用基本的文件读取函数 readLines

读取 csv

使用 base 的 read.csv 函数

read.csv 是 R 语言中用于读取 CSV 文件的基本函数,它会将 CSV 文件读取为一个数据框对象

假设有一个名为 data.csv 的 CSV 文件,内容如下:

id,name,age
1,John,25
2,Jane,30
3,Bob,28

读取:


data  read.csv("data.csv")


print(data)

输出:

  id name age
1  1 John  25
2  2 Jane  30
3  3  Bob  28

使用 readr 包的 read_csv 函数

readr 包提供了更为快速和灵活的 CSV 读取函数 read_csv 特别适合大型数据集的处理





library(readr)


data  read_csv("data.csv")


print(data)

读取 xlsx

使用 xlsx 包的 read.xlsx 函数

xlsx 包提供了一种读取 Excel 文件的方法,适用于较旧版本的 Excel 文件(.xlsx 格式)

假设有一个名为 data.xlsx 的 Excel 文件,内容如下:

id name
1 zhangsan
2 lisi
3 wangwu

读取:





library(xlsx)


data  read.xlsx("data.xlsx", sheetIndex = 1)


print(data)

输出:

  id name
1  1 zhangsan
2  2 lisi
3  3  wangwu

使用 readxl 包的 read_excel 函数

readxl 包提供了更为现代和高效的方法来读取 Excel 文件,支持更多的 Excel 特性 适合处理各种 Excel 文件格式和大型数据集





library(readxl)


data  read_excel("data.xlsx")


print(data)

读取 txt

使用 base 的文件读取函数 readLines

readLines 函数是 R 语言中用于逐行读取文本文件内容的基本函数

假设有一个名为 data.txt 的文本文件,内容如下:

1 John 25
2 Jane 30
3 Bob 28

读取:


lines  readLines("data.txt")


print(lines)

输出:

[1] "1 John 25" "2 Jane 30" "3 Bob 28"

使用 readr 包的 read_lines 函数

如果需要更为高效地读取文本文件,特别是处理大型文本文件时,可使用 readr 包中的 read_lines 函数





library(readr)


data  read_lines("data.txt")


print(data)

读取 json

使用 jsonlite 包读取 JSON 文件

jsonlite 包提供了在 R 中读取和处理 JSON 数据的功能。可使用其中的函数 fromJSON
来将 JSON 文件读取为 R 中的数据结构,如列表或数据框

假设有一个名为 data.json 的 JSON 文件,内容如下:

[
  {"id": 1, "name": "John", "age": 25},
  {"id": 2, "name": "Jane", "age": 30},
  {"id": 3, "name": "Bob", "age": 28}
]

读取:





library(jsonlite)


data  fromJSON("data.json")


print(data)

输出:

  id name age
1  1 John  25
2  2 Jane  30
3  3  Bob  28

读取 pdf

使用 pdftools 包读取 pdf 文件

pdftools 包支持读取 pdf 文件的内容并进行进一步处理,例如提取文本或分析页面结构

假设有一个名为 document.pdf 的 PDF 文件,内容为一些文本页面:





library(pdftools)


pdf_content  pdf_text("document.pdf")


cat(pdf_content[[1]])

读取 lua

使用基本的文件读取函数 readLines

可使用 R 语言的 readLines 函数来逐行读取 Lua 脚本文件的内容

假设有一个名为 script.lua 的 Lua 脚本文件,内容如下:

function factorial(n)
    if n  1 then
        return 1
    else
        return n * factorial(n - 1)
    end
end

print(factorial(5))

读取:


lines  readLines("script.lua")


print(lines)

输出:

[1] "function factorial(n)"                           
[2] "    if n                               
[3] "return 1"                                
[4] "else"                                        
[5] "return n * factorial(n - 1)"              
[6] "end"                                         
[7] "end"                                             
[8] ""                                                
[9] "print(factorial(5))"

原文地址: R 语言学习笔记 11- 读取 csv-xlsx-txt-json-pdf-lua 格式文件

    正文完
     0
    Yojack
    版权声明:本篇文章由 Yojack 于2024-10-29发表,共计2117字。
    转载说明:
    1 本网站名称:优杰开发笔记
    2 本站永久网址:https://yojack.cn
    3 本网站的文章部分内容可能来源于网络,仅供大家学习与参考,如有侵权,请联系站长进行删除处理。
    4 本站一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
    5 本站所有内容均可转载及分享, 但请注明出处
    6 我们始终尊重原创作者的版权,所有文章在发布时,均尽可能注明出处与作者。
    7 站长邮箱:laylwenl@gmail.com
    评论(没有评论)