maxframe.dataframe.DataFrame.to_csv#
- DataFrame.to_csv(path, sep=',', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, compression='infer', quoting=None, quotechar='"', lineterminator=None, chunksize=None, date_format=None, doublequote=True, escapechar=None, decimal='.', partition_cols=None, storage_options=None, **kw)#
将对象写入逗号分隔值(csv)文件。
- 参数:
path (str) -- 文件路径。如果路径是包含通配符的字符串,例如 '/to/path/out-*.csv',to_csv 将尝试写入多个文件,例如,块 (0, 0) 的数据将写入 '/to/path/out-0.csv'。如果路径是不包含通配符的字符串,所有数据将写入单个文件。
sep (str, default ',') -- 长度为1的字符串。输出文件的字段分隔符。
na_rep (str, default '') -- 缺失数据的表示形式。
float_format (str, default None) -- 浮点数的格式字符串。
columns (sequence, optional) -- 要写入的列。
header (bool or list of str, default True) -- 写入列名。如果提供字符串列表,则假定它们是列名的别名。
index (bool, default True) -- 写入行名(索引)。
index_label (str or sequence, or False, default None) -- 如果需要,为索引列指定列标签。如果给定 None,且 header 和 index 为 True,则使用索引名称。如果对象使用 MultiIndex,应提供序列。如果为 False,则不打印索引名称字段。在 R 中导入时更方便可使用 index_label=False。
mode (str) -- Python 写入模式,默认为 'w'。
encoding (str, optional) -- 表示在输出文件中使用的编码的字符串,默认为 'utf-8'。
compression (str or dict, default 'infer') -- 如果是 str,表示压缩模式;如果是 dict,则 'method' 键的值为压缩模式。压缩模式可以是以下任意值:{'infer', 'gzip', 'bz2', 'zip', 'xz', None}。如果压缩模式为 'infer' 且 path_or_buf 是路径形式,则根据以下扩展名检测压缩模式:'.gz', '.bz2', '.zip' 或 '.xz'(否则不压缩)。如果提供了 dict 且模式为 'zip' 或推断为 'zip',其他条目将作为附加压缩选项传递。
quoting (optional constant from csv module) -- 默认为 csv.QUOTE_MINIMAL。如果你设置了 float_format,浮点数会被转换为字符串,因此 csv.QUOTE_NONNUMERIC 会将它们视为非数字。
quotechar (str, default '"') -- 长度为1的字符串。用于引用字段的字符。
lineterminator (str, optional) -- 在输出文件中使用的换行字符或字符序列。默认为 os.linesep,其取决于调用此方法的操作系统(Linux 为 'n',Windows 为 'rn' 等)。
chunksize (int or None) -- 一次写入的行数。
date_format (str, default None) -- 日期时间对象的格式字符串。
doublequote (bool, default True) -- 控制字段内 quotechar 的引用方式。
escapechar (str, default None) -- 长度为1的字符串。在适当情况下用于转义 sep 和 quotechar 的字符。
decimal (str, default '.') -- 被识别为小数点分隔符的字符。例如,欧洲数据使用 ','。
partition_cols (list, optional, default None) -- 用于分区数据集的列名。列按照给定的顺序进行分区。
- 返回:
如果 path_or_buf 为 None,返回结果 CSV 格式的字符串。否则返回 None。
- 返回类型:
None or str
参见
read_csv将 CSV 文件加载到 DataFrame。
示例
>>> import maxframe.dataframe as md >>> df = md.DataFrame({'name': ['Raphael', 'Donatello'], ... 'mask': ['red', 'purple'], ... 'weapon': ['sai', 'bo staff']}) >>> df.to_csv('out.csv', index=False).execute() >>> # Write partitioned dataset >>> df.to_csv('dataset', partition_cols=['mask']).execute()