jsonl文件介绍

10,217次阅读
没有评论

共计 962 个字符,预计需要花费 3 分钟才能阅读完成。

一、jsonl 文件格式

jsonl 文件格式是 JSON Lines 的缩写,它是一种文本格式,用于存储结构化数据,类似于 JSON。

在 .jsonl 文件中,每一行包含一个完整的 JSON 对象,这些对象之间通过新行(换行符)分隔。这种格式非常适合处理大量的数据记录,因为它允许逐行读取和写入,而不需要一次性加载整个文件到内存中。

数据在 .jsonl 文件中将会是:

{"name": "Alice", "age": 30}
{"name": "Bob", "age": 25}

而相同的 JSON 文件可能看起来像这样:

[
  {"name": "Alice", "age": 30},
  {"name": "Bob", "age": 25}
]

.jsonl 每一行都是一个独立的 JSON 对象,可以单独解析。这种格式特别适合日志数据、大型数据集、流数据处理以及需要增量加载或存储的场景。

二、.jsonl 文件读取

import json


with open('data.jsonl', 'r') as file:
    
    for line in file:
        
        data = json.loads(line.strip())
        
        
        print(data)

二、.jsonl 文件保存

要将数据保存为 .jsonl 格式的文件,你需要确保每条数据都是一个有效的 JSON 对象,并且将每个对象转换为 JSON 字符串后逐行写入文件。以下是使用 Python 将数据保存为 .jsonl 文件的示例代码:

import json


data_list = [
    {"name": "Alice", "age": 30},
    {"name": "Bob", "age": 25}
]


with open('data.jsonl', 'w') as file:
    
    for data in data_list:
        
        json_str = json.dumps(data)
        
        file.write(json_str + 'n')

在这段代码中:

  • 使用 json.dumps() 函数将字典转换为 JSON 格式的字符串。
  • 将 JSON 字符串写入文件,并在每个 JSON 字符串后面添加一个换行符 n 以确保每个 JSON 对象占据一行。
  • 使用 with 语句来打开文件,这样可以保证文件在写入操作完成后正确关闭。
  • 这样写入后,data.jsonl 文件的内容将会是:
{"name": "Alice", "age": 30}
{"name": "Bob", "age": 25}

原文地址: jsonl 文件介绍

    正文完
     0
    Yojack
    版权声明:本篇文章由 Yojack 于2024-10-07发表,共计962字。
    转载说明:
    1 本网站名称:优杰开发笔记
    2 本站永久网址:https://yojack.cn
    3 本网站的文章部分内容可能来源于网络,仅供大家学习与参考,如有侵权,请联系站长进行删除处理。
    4 本站一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
    5 本站所有内容均可转载及分享, 但请注明出处
    6 我们始终尊重原创作者的版权,所有文章在发布时,均尽可能注明出处与作者。
    7 站长邮箱:laylwenl@gmail.com
    评论(没有评论)