Настройки форматов
Эти настройки автоматически сгенерированы из исходного кода.
allow_special_bool_values_inside_variant
Позволяет разбирать значения Bool внутри типа Variant из специальных текстовых булевых значений, таких как "on", "off", "enable", "disable" и т. д.
bool_false_representation
Текст, используемый для представления значения false логического типа в форматах TSV/CSV/Vertical/Pretty.
bool_true_representation
Текстовое представление логического значения true в форматах TSV/CSV/Vertical/Pretty.
column_names_for_schema_inference
Список названий столбцов, используемых для вывода схемы для форматов без названий столбцов. Формат: 'column1,column2,column3,...'
cross_to_inner_join_rewrite
Использовать INNER JOIN вместо запятой/CROSS JOIN, если в секции WHERE есть выражения соединения. Значения: 0 — не переписывать, 1 — по возможности применять для запятой/CROSS JOIN, 2 — принудительно переписывать все соединения через запятую, cross — по возможности.
date_time_64_output_format_cut_trailing_zeros_align_to_groups_of_thousands
Динамически удаляет конечные нули в значениях datetime64, чтобы корректировать масштаб вывода до [0, 3, 6],
соответствующих «секундам», «миллисекундам» и «микросекундам».
date_time_input_format
Позволяет выбрать парсер текстового представления даты и времени.
Настройка не применяется к функциям для работы с датой и временем.
Возможные значения:
-
'best_effort'— Включает расширенный режим разбора.ClickHouse может разбирать базовый формат
YYYY-MM-DD HH:MM:SSи все форматы даты и времени ISO 8601. Например,'2018-06-08T01:02:03.000Z'. -
'best_effort_us'— Аналогичноbest_effort(см. отличие в parseDateTimeBestEffortUS). -
'basic'— Использовать базовый парсер.ClickHouse может разбирать только базовый формат
YYYY-MM-DD HH:MM:SSилиYYYY-MM-DD. Например,2019-08-20 10:18:56или2019-08-20.
Значение по умолчанию в ClickHouse Cloud: 'best_effort'.
См. также:
date_time_output_format
Позволяет выбрать формат текстового представления даты и времени при выводе.
Возможные значения:
-
simple— простой формат вывода.ClickHouse выводит дату и время в формате
YYYY-MM-DD hh:mm:ss. Например,2019-08-20 10:18:56. Расчёт выполняется в соответствии с часовым поясом типа данных (если он задан) или часовым поясом сервера. -
iso— формат вывода ISO.ClickHouse выводит дату и время в формате ISO 8601
YYYY-MM-DDThh:mm:ssZ. Например,2019-08-20T10:18:56Z. Обратите внимание, что вывод производится в UTC (Zозначает UTC). -
unix_timestamp— формат вывода Unix timestamp.ClickHouse выводит дату и время в формате Unix timestamp. Например,
1566285536.
См. также:
date_time_overflow_behavior
Определяет поведение при преобразовании типов Date, Date32, DateTime, DateTime64 или целочисленных значений в типы Date, Date32, DateTime или DateTime64, когда значение не может быть представлено в результирующем типе.
Возможные значения:
ignore— Без уведомления игнорировать переполнения. Результат не определён.throw— Выбрасывать исключение в случае переполнения.saturate— Насыщать результат. Если значение меньше минимального значения, которое может быть представлено целевым типом, в качестве результата выбирается минимальное представимое значение. Если значение больше максимального значения, которое может быть представлено целевым типом, в качестве результата выбирается максимальное представимое значение.
Значение по умолчанию: ignore.
dictionary_use_async_executor
Запускает конвейер чтения из источника словаря в нескольких потоках. Поддерживается только словарями с локальным источником CLICKHOUSE.
errors_output_format
Метод записи ошибок в текстовый вывод.
exact_rows_before_limit
Когда этот параметр включён, ClickHouse будет возвращать точное значение статистики rows_before_limit_at_least, но ценой того, что данные до применения LIMIT придётся полностью прочитать.
format_avro_schema_registry_url
Для формата AvroConfluent: URL-адрес реестра схем Confluent.
format_binary_max_array_size
Максимально допустимый размер Array в формате RowBinary. Это предотвращает выделение большого объёма памяти при повреждении данных. Значение 0 означает отсутствие ограничения.
format_binary_max_string_size
Максимально допустимый размер значения типа String в формате RowBinary. Предотвращает выделение большого объёма памяти в случае повреждённых данных. Значение 0 означает отсутствие ограничения.
format_capn_proto_enum_comparising_mode
Как сопоставлять перечисления Enum ClickHouse и CapnProto
format_capn_proto_use_autogenerated_schema
Использовать автоматически сгенерированную схему CapnProto, если format_schema не задан
format_csv_allow_double_quotes
Если установлено в значение true, разрешает строки, заключённые в двойные кавычки.
format_csv_allow_single_quotes
Если установлено в true, разрешает использование строк в одинарных кавычках.
format_csv_delimiter
Символ, который будет использоваться как разделитель в данных CSV. Если задаёте значение строкой, длина строки должна быть равна 1.
format_csv_null_representation
Настраиваемое представление NULL в формате CSV
format_custom_escaping_rule
Правило экранирования полей (для формата CustomSeparated)
format_custom_field_delimiter
Разделитель между полями (для формата CustomSeparated)
format_custom_result_after_delimiter
Суффикс, добавляемый после набора результатов (для формата CustomSeparated)
format_custom_result_before_delimiter
Префикс перед результирующим набором (для формата CustomSeparated)
format_custom_row_after_delimiter
Разделитель после поля в последнем столбце (для формата CustomSeparated)
format_custom_row_before_delimiter
Разделитель перед полем в первом столбце (для формата CustomSeparated)
format_custom_row_between_delimiter
Разделитель между строками (для формата CustomSeparated)
format_display_secrets_in_show_and_select
Включает или отключает отображение секретов в запросах SHOW и SELECT для таблиц, баз данных,
табличных функций и словарей.
Чтобы пользователь мог видеть секреты, у него также должна быть включена
настройка сервера display_secrets_in_show_and_select
и выдана привилегия
displaySecretsInShowAndSelect.
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
format_json_object_each_row_column_for_object_name
Имя столбца, которое будет использоваться для хранения/записи имён объектов в формате JSONObjectEachRow.
Тип столбца должен быть String. Если значение не задано, им объектам будут присвоены имена по умолчанию row_{i}.
format_protobuf_use_autogenerated_schema
Использовать автоматически сгенерированный Protobuf, если format_schema не задан
format_regexp
Регулярное выражение (для формата Regexp)
format_regexp_escaping_rule
Правило экранирования полей (для формата Regexp)
format_regexp_skip_unmatched
Пропускать строки, не соответствующие регулярному выражению (для формата Regexp)
format_schema
Этот параметр используется при работе с форматами, которым требуется определение схемы, такими как Cap'n Proto или Protobuf. Его значение зависит от формата.
format_schema_message_name
Определяет имя требуемого сообщения в схеме, заданной в format_schema.
Чтобы сохранить совместимость с устаревшим форматом format_schema (file_name:message_name):
- Если
format_schema_message_nameне указан, имя сообщения извлекается из частиmessage_nameустаревшего значенияformat_schema. - Если
format_schema_message_nameуказан при использовании устаревшего формата, будет сгенерирована ошибка.
format_schema_source
Определяет источник значения format_schema.
Возможные значения:
- 'file' (по умолчанию):
format_schema— это имя файла схемы, расположенного в директорииformat_schemas. - 'string':
format_schema— это буквальное содержимое схемы. - 'query':
format_schema— это запрос для получения схемы. Когда дляformat_schema_sourceустановлено значение 'query', применяются следующие условия: - Запрос должен возвращать ровно одно значение: одну строку с одним столбцом строкового типа.
- Результат запроса трактуется как содержимое схемы.
- Этот результат кэшируется локально в директории
format_schemas. - Вы можете очистить локальный кэш с помощью команды:
SYSTEM DROP FORMAT SCHEMA CACHE FOR Files. - После кэширования идентичные запросы не выполняются повторно для получения схемы, пока кэш явно не очищен.
- В дополнение к локальным файлам кэша сообщения Protobuf также кэшируются в оперативной памяти. Даже после очистки локальных файлов кэша кэш в памяти необходимо очистить с помощью
SYSTEM DROP FORMAT SCHEMA CACHE [FOR Protobuf], чтобы полностью обновить схему. - Выполните запрос
SYSTEM DROP FORMAT SCHEMA CACHE, чтобы очистить кэш как для файлов кэша, так и для схем сообщений Protobuf одновременно.
format_template_resultset
Путь к файлу, содержащему строку формата для результирующего набора (для формата Template)
format_template_resultset_format
Форматная строка для результирующего набора данных (для формата Template)
format_template_row
Путь к файлу, содержащему строку формата для строк (для формата Template)
format_template_row_format
Форматная строка для строк (для формата Template)
format_template_rows_between_delimiter
Разделитель строк (для формата Template)
format_tsv_null_representation
Настраиваемое представление значения NULL в формате TSV
input_format_allow_errors_num
Устанавливает максимальное число допустимых ошибок при чтении из текстовых форматов (CSV, TSV и т. д.).
Значение по умолчанию — 0.
Всегда используйте вместе с input_format_allow_errors_ratio.
Если при чтении строк произошла ошибка, но счётчик ошибок всё ещё меньше input_format_allow_errors_num, ClickHouse игнорирует строку и переходит к следующей.
Если превышены и input_format_allow_errors_num, и input_format_allow_errors_ratio, ClickHouse генерирует исключение.
input_format_allow_errors_ratio
Устанавливает максимальный процент допускаемых ошибок при чтении текстовых форматов (CSV, TSV и т. д.). Процент ошибок задаётся числом с плавающей запятой в диапазоне от 0 до 1.
Значение по умолчанию — 0.
Всегда используйте этот параметр вместе с input_format_allow_errors_num.
Если при чтении строк произошла ошибка, но счётчик ошибок всё ещё меньше input_format_allow_errors_ratio, ClickHouse игнорирует строку и переходит к следующей.
Если превышены и input_format_allow_errors_num, и input_format_allow_errors_ratio, ClickHouse выбрасывает исключение.
input_format_allow_seeks
Позволяет выполнять произвольное позиционирование (seek) при чтении во входных форматах ORC/Parquet/Arrow.
Включено по умолчанию.
input_format_arrow_allow_missing_columns
Разрешает отсутствие столбцов при чтении входных форматов Arrow
input_format_arrow_case_insensitive_column_matching
Игнорировать регистр при сопоставлении столбцов Arrow со столбцами CH.
input_format_arrow_skip_columns_with_unsupported_types_in_schema_inference
Пропускать столбцы с неподдерживаемыми типами при определении схемы для формата Arrow
input_format_avro_allow_missing_fields
Для форматов Avro/AvroConfluent: при отсутствии поля в схеме использовать значение по умолчанию вместо возникновения ошибки
input_format_avro_null_as_default
Для формата Avro/AvroConfluent: подставлять значение по умолчанию при получении NULL для столбца с типом, не допускающим NULL
input_format_binary_decode_types_in_binary_format
Читать типы данных в двоичном формате вместо названий типов во входном формате RowBinaryWithNamesAndTypes
input_format_binary_read_json_as_string
Считывает значения типа данных JSON в формате ввода RowBinary как значения типа String, содержащие JSON.
input_format_bson_skip_fields_with_unsupported_types_in_schema_inference
Пропускать поля с неподдерживаемыми типами при автоматическом определении схемы для формата BSON.
input_format_capn_proto_skip_fields_with_unsupported_types_in_schema_inference
Пропускать столбцы с неподдерживаемыми типами при автоматическом определении схемы для формата CapnProto
input_format_csv_allow_cr_end_of_line
Если установлено в значение true, символ \r будет допускаться в конце строки, если за ним не следует
input_format_csv_allow_variable_number_of_columns
Игнорировать лишние столбцы во входных данных CSV (если файл содержит больше столбцов, чем ожидается) и использовать значения по умолчанию для отсутствующих полей во входных данных CSV
input_format_csv_allow_whitespace_or_tab_as_delimiter
Разрешает использовать пробелы и табуляцию (\t) в качестве разделителя полей в строках CSV
input_format_csv_arrays_as_nested_csv
При чтении значения типа Array из CSV предполагается, что его элементы были сериализованы во вложенный CSV и затем помещены в строку. Пример: "[""Hello"", ""world"", ""42"""" TV""]". Квадратные скобки вокруг массива можно опустить.
input_format_csv_deserialize_separate_columns_into_tuple
Если параметр установлен в значение true, отдельные столбцы, записанные в формате CSV, могут быть десериализованы в столбец типа Tuple.
input_format_csv_detect_header
Автоматически определять наличие заголовка с именами и типами в формате CSV
input_format_csv_empty_as_default
Рассматривать пустые поля во входных данных CSV как значения по умолчанию.
input_format_csv_enum_as_number
Рассматривать вставляемые значения Enum в форматах CSV как числовые индексы перечисления
input_format_csv_skip_first_lines
Пропускает указанное количество строк в начале данных в формате CSV
input_format_csv_skip_trailing_empty_lines
Пропускать пустые строки в конце CSV
input_format_csv_trim_whitespaces
Удаляет пробелы и символы табуляции (\t) в начале и в конце строк CSV
input_format_csv_try_infer_numbers_from_strings
Если включено, при определении схемы ClickHouse будет пытаться определять числа в строковых полях. Это может быть полезно, если данные CSV содержат заключённые в кавычки числа типа UInt64.
По умолчанию отключено.
input_format_csv_try_infer_strings_from_quoted_tuples
Интерпретирует заключённые в кавычки кортежи во входных данных как значение типа String.
input_format_csv_use_best_effort_in_schema_inference
Применять дополнительные приёмы и эвристики для определения схемы по данным в формате CSV
input_format_csv_use_default_on_bad_values
Позволяет задавать значение по умолчанию для столбца, если при десериализации поля CSV произошла ошибка из‑за некорректного значения
input_format_custom_allow_variable_number_of_columns
Игнорировать лишние столбцы во входных данных CustomSeparated (если в файле больше столбцов, чем ожидается) и рассматривать отсутствующие поля во входных данных CustomSeparated как значения по умолчанию
input_format_custom_detect_header
Автоматически распознавать заголовок с именами столбцов и их типами в формате CustomSeparated
input_format_custom_skip_trailing_empty_lines
Пропускать пустые строки в конце в формате CustomSeparated
input_format_defaults_for_omitted_fields
При выполнении запросов INSERT пропущенные значения входных столбцов заменяются значениями по умолчанию для соответствующих столбцов. Этот параметр применяется к форматам JSONEachRow (и другим JSON-форматам), CSV, TabSeparated, TSKV, Parquet, Arrow, Avro, ORC, Native, а также к форматам с суффиксами WithNames/WithNamesAndTypes.
Когда этот параметр включён, расширенные метаданные таблицы передаются от сервера к клиенту. Это потребляет дополнительные вычислительные ресурсы на сервере и может снизить производительность.
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
input_format_force_null_for_omitted_fields
Принудительно инициализировать опущенные поля значением NULL
input_format_hive_text_allow_variable_number_of_columns
Игнорировать лишние столбцы во входных данных Hive Text (если файл содержит больше столбцов, чем ожидается) и обрабатывать отсутствующие поля во входных данных Hive Text как значения по умолчанию.
input_format_hive_text_collection_items_delimiter
Разделитель между элементами коллекции (array или map) в текстовом файле Hive (Hive Text File)
input_format_hive_text_fields_delimiter
Разделитель между полями в текстовом файле Hive
input_format_hive_text_map_keys_delimiter
Разделитель между элементами (парами ключ–значение) отображения (map) в Hive Text File
input_format_import_nested_json
Включает или отключает вставку JSON-данных со вложенными объектами.
Поддерживаемые форматы:
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
См. также:
- Использование вложенных структур с форматом
JSONEachRow.
input_format_ipv4_default_on_conversion_error
Десериализация IPv4 будет использовать значения по умолчанию вместо выбрасывания исключения при ошибке преобразования.
По умолчанию отключено.
input_format_ipv6_default_on_conversion_error
При десериализации IPv6-адресов вместо выбрасывания исключения при ошибке преобразования будут использоваться значения по умолчанию.
По умолчанию параметр отключён.
input_format_json_compact_allow_variable_number_of_columns
Разрешает использовать переменное количество столбцов в строках во входных форматах JSONCompact/JSONCompactEachRow. Игнорирует лишние столбцы в строках, содержащих больше столбцов, чем ожидается, и считает отсутствующие столбцы значениями по умолчанию.
По умолчанию отключено.
input_format_json_defaults_for_missing_elements_in_named_tuple
Подставлять значения по умолчанию для отсутствующих элементов в JSON-объекте при разборе именованного кортежа.
Этот параметр работает только при включённой настройке input_format_json_named_tuples_as_objects.
Включено по умолчанию.
input_format_json_empty_as_default
Если параметр включён, пустые поля во входном JSON заменяются значениями по умолчанию. Для сложных выражений значений по умолчанию необходимо также включить input_format_defaults_for_omitted_fields.
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
input_format_json_ignore_unknown_keys_in_named_tuple
Игнорирует неизвестные ключи в JSON-объекте для именованных кортежей.
Включено по умолчанию.
input_format_json_ignore_unnecessary_fields
Игнорировать ненужные поля и не парсить их. Включение этой настройки может привести к тому, что исключения не будут генерироваться для JSON-строк с некорректным форматом или с дублирующимися полями.
input_format_json_infer_array_of_dynamic_from_array_of_different_types
Если параметр включён, во время определения схемы ClickHouse будет использовать тип Array(Dynamic) для JSON-массивов со значениями разных типов данных.
Пример:
Включено по умолчанию.
input_format_json_infer_incomplete_types_as_strings
Разрешает использовать тип String для JSON-ключей, которые содержат только Null/{}/[] в образце данных при выводе схемы.
В JSON-форматах любое значение может быть считано как String, и мы можем избежать ошибок вида Cannot determine type for column 'column_name' by first 25000 rows of data, most likely this column contains only Nulls or empty Arrays/Maps при выводе схемы,
используя тип String для ключей с неизвестными типами.
Пример:
Результат:
Включено по умолчанию.
input_format_json_map_as_array_of_tuples
Десериализует столбцы типа Map в виде JSON-массивов кортежей.
По умолчанию отключено.
input_format_json_max_depth
Максимальная глубина поля в JSON. Это не строгое ограничение, его не обязательно соблюдать в точности.
input_format_json_named_tuples_as_objects
Разбирать столбцы с именованными кортежами как объекты JSON.
Включено по умолчанию.
input_format_json_read_arrays_as_strings
Позволяет разбирать массивы JSON как строки во входных форматах JSON.
Пример:
Результат:
Включено по умолчанию.
input_format_json_read_bools_as_numbers
Разрешает парсинг логических значений типа bool как чисел во входных форматах JSON.
Включено по умолчанию.
input_format_json_read_bools_as_strings
Разрешает интерпретировать логические значения как строки во входных форматах JSON.
Включено по умолчанию.
input_format_json_read_numbers_as_strings
Позволяет разбирать числа как строки во входных форматах JSON.
Включено по умолчанию.
input_format_json_read_objects_as_strings
Разрешает парсить объекты JSON как строки во входных форматах JSON.
Пример:
Результат:
По умолчанию включено.
input_format_json_throw_on_bad_escape_sequence
Выбрасывать исключение, если JSON-строка содержит некорректную escape-последовательность во входных форматах JSON. Если параметр отключен, некорректные escape-последовательности будут сохранены в данных без изменений.
По умолчанию включен.
input_format_json_try_infer_named_tuples_from_objects
Если параметр включён, при определении схемы ClickHouse будет пытаться выводить именованные Tuple из JSON-объектов.
Полученный именованный Tuple будет содержать все элементы из всех соответствующих JSON-объектов в выборке данных.
Пример:
Результат:
Включено по умолчанию.
input_format_json_try_infer_numbers_from_strings
Если включено, при определении схемы ClickHouse будет пытаться распознавать числовые значения в строковых полях. Это может быть полезно, если JSON‑данные содержат заключённые в кавычки числа типа UInt64.
По умолчанию выключено.
input_format_json_use_string_type_for_ambiguous_paths_in_named_tuples_inference_from_objects
Использовать тип String вместо генерации исключения в случае неоднозначных путей в объектах JSON при выводе типа именованных кортежей
input_format_json_validate_types_from_metadata
Для входных форматов JSON/JSONCompact/JSONColumnsWithMetadata, если этот параметр принимает значение 1, типы из метаданных во входных данных будут сравниваться с типами соответствующих столбцов в таблице.
Включено по умолчанию.
input_format_max_block_size_bytes
Ограничивает размер блоков, формируемых при разборе данных во входных форматах, в байтах. Используется в построчных входных форматах, когда блок формируется на стороне ClickHouse. 0 означает отсутствие ограничения по размеру в байтах.
input_format_max_bytes_to_read_for_schema_inference
Максимальный объём данных в байтах, считываемый для автоматического вывода схемы.
input_format_max_rows_to_read_for_schema_inference
Максимальное количество строк данных, считываемых при автоматическом определении схемы.
input_format_msgpack_number_of_columns
Количество столбцов во вставляемых данных в формате MsgPack. Используется для автоматического вывода схемы по данным.
input_format_mysql_dump_map_column_names
Сопоставлять столбцы в дампе MySQL и столбцы таблицы ClickHouse по именам
input_format_mysql_dump_table_name
Имя таблицы в дампе MySQL, из которой читать данные
input_format_native_allow_types_conversion
Разрешает преобразование типов данных в формате ввода Native
input_format_native_decode_types_in_binary_format
Считывать типы данных в двоичном формате вместо их названий в формате ввода Native
input_format_null_as_default
Включает или отключает инициализацию полей NULL значениями по умолчанию, если тип данных этих полей не является Nullable.
Если тип столбца не Nullable и эта настройка отключена, вставка NULL приводит к исключению. Если тип столбца Nullable, то значения NULL вставляются как есть, независимо от этой настройки.
Эта настройка применима к большинству форматов ввода.
Для сложных выражений по умолчанию настройка input_format_defaults_for_omitted_fields также должна быть включена.
Возможные значения:
- 0 — вставка
NULLв столбец с типом, не допускающим Nullable, приводит к исключению. - 1 — поля
NULLинициализируются значениями столбца по умолчанию.
input_format_orc_allow_missing_columns
Разрешает отсутствие столбцов при чтении входных данных в формате ORC
input_format_orc_case_insensitive_column_matching
Игнорировать регистр при сопоставлении столбцов ORC со столбцами ClickHouse.
input_format_orc_dictionary_as_low_cardinality
Обрабатывать столбцы ORC, закодированные с помощью словаря, как столбцы LowCardinality при чтении файлов ORC.
input_format_orc_filter_push_down
При чтении файлов ORC целиком пропускаются страйпы (stripes) или группы строк на основе выражений WHERE/PREWHERE, статистики min/max или фильтра Блума в метаданных ORC.
input_format_orc_reader_time_zone_name
Имя часового пояса для ORC row reader; по умолчанию используется часовой пояс GMT.
input_format_orc_row_batch_size
Размер пакета при чтении страйпов ORC.
input_format_orc_skip_columns_with_unsupported_types_in_schema_inference
Пропускать столбцы с неподдерживаемыми типами при определении схемы для формата ORC
input_format_orc_use_fast_decoder
Использовать более быструю реализацию декодера ORC.
input_format_parquet_allow_geoparquet_parser
Использовать парсер геоколонок для преобразования значений Array(UInt8) в типы Point/Linestring/Polygon/MultiLineString/MultiPolygon
input_format_parquet_allow_missing_columns
Допускает отсутствие столбцов при чтении входных данных в формате Parquet
input_format_parquet_bloom_filter_push_down
При чтении файлов Parquet позволяет пропускать целые группы строк на основе выражений WHERE и bloom-фильтра в метаданных Parquet.
input_format_parquet_case_insensitive_column_matching
Игнорировать регистр при сопоставлении столбцов Parquet со столбцами ClickHouse.
input_format_parquet_enable_json_parsing
При чтении файлов Parquet разбирать столбцы JSON как столбцы JSON в ClickHouse.
input_format_parquet_enable_row_group_prefetch
Включает предварительную выборку групп строк при разборе Parquet. В данный момент предварительная выборка поддерживается только при однопоточном разборе.
input_format_parquet_filter_push_down
При чтении файлов Parquet целые группы строк пропускаются на основе выражений WHERE/PREWHERE и статистики минимальных и максимальных значений в метаданных Parquet.
input_format_parquet_local_file_min_bytes_for_seek
Минимальный размер локального чтения (из файла) в байтах, при котором выполняется seek вместо чтения с пропуском в формате ввода Parquet
input_format_parquet_local_time_as_utc
Определяет тип данных, используемый при автоматическом выводе схемы для временных меток Parquet с isAdjustedToUTC=false. Если значение true: DateTime64(..., 'UTC'), если false: DateTime64(...). Ни один из вариантов не является полностью корректным, так как в ClickHouse нет типа данных для локального «настенного» времени. На первый взгляд парадоксально, но вариант true, вероятно, менее некорректен, поскольку форматирование временной метки с 'UTC' как String приведёт к представлению корректного локального времени.
input_format_parquet_max_block_size
Максимальный размер блока для ридера формата Parquet.
input_format_parquet_memory_high_watermark
Приблизительное ограничение объёма памяти для ридера Parquet v3. Ограничивает количество групп строк или столбцов, которые могут считываться параллельно. При чтении нескольких файлов в одном запросе лимит применяется к общему использованию памяти всеми этими файлами.
input_format_parquet_memory_low_watermark
Более агрессивно планирует предварительную выборку, если использование памяти ниже заданного порогового значения. Потенциально полезно, например, когда по сети необходимо прочитать множество небольших bloom-фильтров.
input_format_parquet_page_filter_push_down
Пропускает страницы на основе минимальных и максимальных значений из индекса столбца.
input_format_parquet_prefer_block_bytes
Средний размер блока в байтах, возвращаемого ридером Parquet
input_format_parquet_preserve_order
Не изменяет порядок строк при чтении из файлов Parquet. Не рекомендуется к использованию, так как порядок строк, как правило, не гарантируется, а другие части конвейера обработки запроса могут его нарушить. Вместо этого используйте ORDER BY _row_number.
input_format_parquet_skip_columns_with_unsupported_types_in_schema_inference
Пропускать столбцы с неподдерживаемыми типами при определении схемы для формата Parquet
input_format_parquet_use_native_reader
Использовать нативный ридер Parquet v1. Достаточно быстрый, но ещё не доработан. Устарел.
input_format_parquet_use_native_reader_v3
Использовать считыватель Parquet v3.
input_format_parquet_use_offset_index
Небольшое изменение в способе чтения страниц из файла Parquet, когда не используется фильтрация страниц.
input_format_parquet_verify_checksums
Проверяет контрольные суммы страниц при чтении файлов Parquet.
input_format_protobuf_flatten_google_wrappers
Включает использование Google wrappers для обычных невложенных столбцов, например google.protobuf.StringValue 'str' для столбца типа String str. Для столбцов Nullable пустые wrappers интерпретируются как значения по умолчанию, а отсутствующие — как NULL.
input_format_protobuf_oneof_presence
Определяет, какое поле protobuf oneof было обнаружено, путем установки значения перечисления в специальном столбце
input_format_protobuf_skip_fields_with_unsupported_types_in_schema_inference
Пропускать поля с неподдерживаемыми типами при определении схемы для формата Protobuf
input_format_record_errors_file_path
Путь к файлу, в который записываются ошибки при чтении текстовых форматов (CSV, TSV).
input_format_skip_unknown_fields
Включает или отключает пропуск лишних данных при вставке.
При записи данных ClickHouse выбрасывает исключение, если входные данные содержат столбцы, которых нет в целевой таблице. Если пропуск включён, ClickHouse не вставляет лишние данные и не выбрасывает исключение.
Поддерживаемые форматы:
- JSONEachRow (и другие форматы JSON)
- BSONEachRow (и другие форматы JSON)
- TSKV
- Все форматы с суффиксами WithNames/WithNamesAndTypes
- MySQLDump
- Native
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
input_format_try_infer_dates
Если включено, ClickHouse пытается определять тип Date по строковым полям при автоматическом определении схемы для текстовых форматов. Если все значения столбца во входных данных были успешно разобраны как даты, результирующим типом будет Date. Если хотя бы одно значение не было разобрано как дата, результирующим типом будет String.
По умолчанию включено.
input_format_try_infer_datetimes
Если параметр включен, ClickHouse будет пытаться определить тип DateTime64 по строковым полям при автоматическом определении схемы для текстовых форматов. Если все значения столбца во входных данных были успешно интерпретированы как значения даты и времени, результирующим типом будет DateTime64; если хотя бы одно значение не было интерпретировано как дата и время, результирующим типом будет String.
По умолчанию включен.
input_format_try_infer_datetimes_only_datetime64
Когда input_format_try_infer_datetimes включён, определяется только тип DateTime64, а не DateTime.
input_format_try_infer_exponent_floats
Пытаться распознавать числа с плавающей запятой в экспоненциальной нотации при автоматическом определении схемы в текстовых форматах (кроме JSON, где числа с экспонентой всегда распознаются)
input_format_try_infer_integers
Если параметр включён, ClickHouse будет пытаться определять целые числа вместо чисел с плавающей запятой при выводе схемы для текстовых форматов. Если все числа в столбце входных данных — целые, результирующим типом будет Int64, если хотя бы одно число — с плавающей запятой, результирующим типом будет Float64.
Включён по умолчанию.
input_format_try_infer_variants
Если параметр включен, ClickHouse будет пытаться определять тип Variant при выводе схемы для текстовых форматов, когда для элементов столбца или массива возможно более одного типа.
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
input_format_tsv_allow_variable_number_of_columns
Игнорировать лишние столбцы во входных данных TSV (если в файле больше столбцов, чем ожидается) и считать отсутствующие поля во входных данных TSV значениями по умолчанию
input_format_tsv_crlf_end_of_line
Если установлено значение true, функция file будет читать формат TSV с \r\n вместо \n.
input_format_tsv_detect_header
Автоматически определять строку заголовка с именами столбцов и их типами в формате TSV
input_format_tsv_empty_as_default
Считать пустые поля во входных данных TSV значениями по умолчанию.
input_format_tsv_enum_as_number
Обрабатывать вставляемые значения Enum в форматах TSV как числовые индексы Enum.
input_format_tsv_skip_first_lines
Пропускает заданное количество строк в начале данных в формате TSV
input_format_tsv_skip_trailing_empty_lines
Пропускать пустые строки в конце данных в формате TSV
input_format_tsv_use_best_effort_in_schema_inference
Использовать дополнительные методы и эвристики для определения схемы в формате TSV
input_format_values_accurate_types_of_literals
Для формата Values: при разборе и интерпретации выражений с использованием шаблона выполняется проверка фактического типа литерала, чтобы избежать возможного переполнения и потери точности.
input_format_values_deduce_templates_of_expressions
Для формата Values: если потоковому парсеру не удалось разобрать поле, запустить SQL-парсер, определить шаблон SQL-выражения, попытаться разобрать все строки, используя этот шаблон, а затем интерпретировать выражение для всех строк.
input_format_values_interpret_expressions
Для формата Values: если потоковому парсеру не удалось разобрать поле, выполнить разбор с помощью SQL-парсера и попытаться интерпретировать его как SQL-выражение.
input_format_with_names_use_header
Включает или отключает проверку порядка столбцов при вставке данных.
Для повышения производительности операций вставки рекомендуется отключить эту проверку, если вы уверены, что порядок столбцов во входных данных совпадает с порядком в целевой таблице.
Поддерживаемые форматы:
- CSVWithNames
- CSVWithNamesAndTypes
- TabSeparatedWithNames
- TabSeparatedWithNamesAndTypes
- JSONCompactEachRowWithNames
- JSONCompactEachRowWithNamesAndTypes
- JSONCompactStringsEachRowWithNames
- JSONCompactStringsEachRowWithNamesAndTypes
- RowBinaryWithNames
- RowBinaryWithNamesAndTypes
- CustomSeparatedWithNames
- CustomSeparatedWithNamesAndTypes
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
input_format_with_types_use_header
Определяет, должен ли парсер формата проверять соответствие типов данных во входных данных типам данных целевой таблицы.
Поддерживаемые форматы:
- CSVWithNamesAndTypes
- TabSeparatedWithNamesAndTypes
- JSONCompactEachRowWithNamesAndTypes
- JSONCompactStringsEachRowWithNamesAndTypes
- RowBinaryWithNamesAndTypes
- CustomSeparatedWithNamesAndTypes
Возможные значения:
- 0 — отключено.
- 1 — включено.
insert_distributed_one_random_shard
Включает или отключает вставку данных в случайный шард таблицы Distributed, когда не задан распределённый ключ.
По умолчанию при вставке данных в таблицу Distributed с более чем одним шардом сервер ClickHouse отклоняет любой запрос на вставку, если распределённый ключ отсутствует. Когда insert_distributed_one_random_shard = 1, вставки разрешены, и данные распределяются случайным образом между всеми шардами.
Возможные значения:
- 0 — Вставка отклоняется, если есть несколько шардов и не задан распределённый ключ.
- 1 — Вставка выполняется случайным образом по всем доступным шардам, когда распределённый ключ не задан.
interval_output_format
Позволяет выбрать формат вывода текстового представления интервальных типов.
Возможные значения:
-
kusto- формат вывода в стиле KQL.ClickHouse выводит интервалы в формате KQL. Например,
toIntervalDay(2)будет иметь формат2.00:00:00. Обратите внимание, что для интервальных типов переменной длины (например,IntervalMonthиIntervalYear) учитывается среднее количество секунд на интервал. -
numeric- числовой формат вывода.ClickHouse выводит интервалы в виде их базового числового представления. Например,
toIntervalDay(2)будет иметь формат2.
См. также:
into_outfile_create_parent_directories
Автоматически создавать родительские директории при использовании INTO OUTFILE, если они ещё не существуют.
json_type_escape_dots_in_keys
При включении точки в ключах JSON будут экранироваться при разборе.
output_format_arrow_compression_method
Метод сжатия для формата вывода Arrow. Поддерживаемые кодеки: lz4_frame, zstd, none (без сжатия).
output_format_arrow_fixed_string_as_fixed_byte_array
Использовать тип данных Arrow FIXED_SIZE_BINARY вместо Binary для столбцов FixedString.
output_format_arrow_low_cardinality_as_dictionary
Включает вывод столбцов типа LowCardinality как столбцов типа Arrow Dictionary
output_format_arrow_string_as_string
Использовать тип Arrow String вместо Binary для строковых столбцов
output_format_arrow_use_64_bit_indexes_for_dictionary
Всегда использовать 64-разрядные целые числа для индексов словаря в формате Arrow
output_format_arrow_use_signed_indexes_for_dictionary
Использовать знаковые целые числа для индексов словаря в формате Arrow
output_format_avro_codec
Кодек сжатия, используемый для вывода. Возможные значения: 'null', 'deflate', 'snappy', 'zstd'.
output_format_avro_rows_in_file
Максимальное количество строк в файле (если допускается хранилищем)
output_format_avro_string_column_pattern
Для формата Avro: регулярное выражение для выбора столбцов типа String, которые следует интерпретировать как строки Avro.
output_format_avro_sync_interval
Интервал синхронизации в байтах.
output_format_binary_encode_types_in_binary_format
Записывать типы данных в бинарном формате вместо имен типов в формате вывода RowBinaryWithNamesAndTypes
output_format_binary_write_json_as_string
Записывает значения типа данных JSON как значения типа String с JSON-содержимым в формате RowBinary.
output_format_bson_string_as_string
Использовать тип BSON String вместо Binary для столбцов типа String.
output_format_csv_crlf_end_of_line
Если установлено значение true, символы конца строки в формате CSV будут \r\n вместо \n.
output_format_csv_serialize_tuple_into_separate_columns
Если установлено значение true, то кортежи (Tuple) в формате CSV сериализуются как отдельные столбцы (то есть их вложенная структура теряется).
output_format_decimal_trailing_zeros
Выводить завершающие нули при отображении значений типа Decimal. Например, 1.230000 вместо 1.23.
По умолчанию — отключено.
output_format_json_array_of_rows
Включает возможность выводить все строки в виде JSON‑массива в формате JSONEachRow.
Возможные значения:
- 1 — ClickHouse выводит все строки в виде массива, где каждая строка представлена в формате
JSONEachRow. - 0 — ClickHouse выводит каждую строку отдельно в формате
JSONEachRow.
Пример запроса с включённой настройкой
Запрос:
Результат:
Пример запроса с отключённым параметром
Запрос:
Результат:
output_format_json_escape_forward_slashes
Управляет экранированием прямых слешей (/) в строковых значениях при выводе в формате JSON. Предназначен для совместимости с JavaScript. Не путайте с обратными слешами (\), которые всегда экранируются.
По умолчанию параметр включён.
output_format_json_map_as_array_of_tuples
Сериализует столбцы Map как JSON-массивы кортежей.
По умолчанию отключено.
output_format_json_named_tuples_as_objects
Сериализует столбцы именованных кортежей в виде JSON-объектов.
Включено по умолчанию.
output_format_json_pretty_print
Этот параметр определяет, как вложенные структуры, такие как Tuples, Maps и Arrays, отображаются внутри массива data при использовании формата вывода JSON.
Например, вместо вывода:
Результат будет отформатирован следующим образом:
Включено по умолчанию.
output_format_json_quote_64bit_floats
Управляет заключением в кавычки 64-битных значений с плавающей запятой при их выводе в форматах JSON*.
По умолчанию отключено.
output_format_json_quote_64bit_integers
Управляет тем, заключаются ли в кавычки целые числа разрядностью 64 бита и более (такие как UInt64 или Int128) при их выводе в формате JSON.
По умолчанию такие целые числа заключаются в кавычки. Это поведение совместимо с большинством реализаций JavaScript.
Возможные значения:
- 0 — целые числа выводятся без кавычек.
- 1 — целые числа заключаются в кавычки.
output_format_json_quote_decimals
Управляет тем, заключаются ли десятичные числа в кавычки в JSON-форматах вывода.
По умолчанию отключено.
output_format_json_quote_denormals
Включает вывод значений +nan, -nan, +inf, -inf в формате JSON.
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
Пример
Рассмотрим следующую таблицу account_orders:
Когда output_format_json_quote_denormals = 0, запрос возвращает значения null в результате:
Когда output_format_json_quote_denormals = 1, запрос возвращает:
output_format_json_skip_null_value_in_named_tuples
Пропускает пары ключ–значение со значением null при сериализации столбцов с именованными кортежами в JSON-объекты. Применяется только, если output_format_json_named_tuples_as_objects имеет значение true.
output_format_json_validate_utf8
Управляет проверкой корректности UTF-8-последовательностей в форматах вывода JSON, не влияет на форматы JSON/JSONCompact/JSONColumnsWithMetadata — они всегда проверяют UTF-8.
По умолчанию настройка отключена.
output_format_markdown_escape_special_characters
При включении специальные символы в Markdown экранируются.
CommonMark определяет следующие специальные символы, которые могут быть экранированы:
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
output_format_msgpack_uuid_representation
Определяет способ вывода UUID в формате MsgPack.
output_format_native_encode_types_in_binary_format
Записывать типы данных в двоичном виде вместо их имен в формате вывода Native
output_format_native_use_flattened_dynamic_and_json_serialization
Записывает данные столбцов JSON и Dynamic в плоском формате (все типы/пути как отдельные подстолбцы).
output_format_native_write_json_as_string
Записывает данные столбца типа JSON как столбец типа String, содержащий строки в формате JSON, вместо используемой по умолчанию нативной сериализации JSON.
output_format_orc_compression_block_size
Размер блока сжатия в байтах для выходного формата ORC.
output_format_orc_compression_method
Метод сжатия для формата вывода ORC. Поддерживаемые кодеки: lz4, snappy, zlib, zstd, none (без сжатия).
output_format_orc_dictionary_key_size_threshold
Для строкового столбца в формате вывода ORC, если количество различных значений больше этой доли от общего числа строк с ненулевыми (non-NULL) значениями, словарное кодирование отключается. В противном случае словарное кодирование включается.
output_format_orc_row_index_stride
Целевой интервал индексации строк в выходном формате ORC
output_format_orc_string_as_string
Использовать тип данных ORC String вместо Binary для столбцов с типом String
output_format_orc_writer_time_zone_name
Название часового пояса, используемого модулем записи ORC; по умолчанию используется часовой пояс GMT.
output_format_parquet_batch_size
Проверять размер страницы после каждого указанного количества строк. Рассмотрите возможность уменьшения значения, если в данных есть столбцы со средним размером значений более нескольких КБ.
output_format_parquet_bloom_filter_bits_per_value
Примерное количество бит, используемых для каждого различного значения в Bloom-фильтрах Parquet. Оценочные значения вероятности ложноположительных срабатываний:
- 6 бит — 10%
- 10.5 бита — 1%
- 16.9 бита — 0.1%
- 26.4 бита — 0.01%
- 41 бит — 0.001%
output_format_parquet_bloom_filter_flush_threshold_bytes
Где в файле Parquet будут размещаться фильтры Блума. Фильтры Блума будут записываться группами приблизительно такого размера. В частности:
- если 0 — фильтры Блума каждой группы строк записываются сразу после соответствующей группы строк;
- если значение больше общего размера всех фильтров Блума — фильтры Блума для всех групп строк будут накапливаться в памяти, а затем записываться вместе ближе к концу файла;
- в противном случае фильтры Блума будут накапливаться в памяти и записываться каждый раз, как только их общий размер превысит это значение.
output_format_parquet_compliant_nested_types
В схеме файла Parquet использовать имя element вместо item для элементов списка. Это исторический артефакт реализации библиотеки Arrow. В общем случае повышает совместимость, за исключением, возможно, некоторых старых версий Arrow.
output_format_parquet_compression_method
Метод сжатия для выходного формата Parquet. Поддерживаемые кодеки: snappy, lz4, brotli, zstd, gzip, none (без сжатия)
output_format_parquet_data_page_size
Целевой размер страницы в байтах перед сжатием.
output_format_parquet_date_as_uint16
Записывать значения типа Date как обычные 16-битные числа (считываются как UInt16), вместо преобразования в 32-битный тип Parquet DATE (считывается как Date32).
output_format_parquet_datetime_as_uint32
Записывать значения DateTime как исходный Unix timestamp (считываются обратно как UInt32), вместо преобразования в миллисекунды (считываются обратно как DateTime64(3)).
output_format_parquet_enum_as_byte_array
Записывает значения enum с физическим типом Parquet BYTE_ARRAY и логическим типом ENUM
output_format_parquet_fixed_string_as_fixed_byte_array
Использовать тип FIXED_LEN_BYTE_ARRAY формата Parquet вместо Binary для столбцов FixedString.
output_format_parquet_geometadata
Позволяет записывать информацию о геометрических столбцах в метаданные Parquet и кодировать столбцы в формате WKB.
output_format_parquet_max_dictionary_size
Если размер словаря превышает это количество байт, используется кодирование без словаря. Установите значение 0, чтобы отключить словарное кодирование.
output_format_parquet_parallel_encoding
Выполняет многопоточное кодирование Parquet. Требует включения настройки output_format_parquet_use_custom_encoder.
output_format_parquet_row_group_size
Целевой размер группы строк (в количестве строк).
output_format_parquet_row_group_size_bytes
Целевой размер группы строк в байтах (до сжатия).
output_format_parquet_string_as_string
Использовать в Parquet тип String вместо Binary для столбцов с типом String.
output_format_parquet_use_custom_encoder
Использовать более быструю реализацию кодировщика Parquet.
output_format_parquet_version
Версия формата Parquet, используемая для формата вывода. Поддерживаемые версии: 1.0, 2.4, 2.6 и 2.latest (по умолчанию)
output_format_parquet_write_bloom_filter
Записывает фильтры Блума в файлы Parquet. Требуется, чтобы параметр output_format_parquet_use_custom_encoder имел значение true.
output_format_parquet_write_checksums
Помещает контрольные суммы CRC32 в заголовки страниц формата Parquet.
output_format_parquet_write_page_index
Записывать индекс столбцов и индекс смещений (т. е. статистику по каждой странице данных, которую можно использовать для проталкивания фильтров при чтении) в файлы Parquet.
output_format_pretty_color
Использовать управляющие последовательности ANSI в форматах Pretty. 0 — отключено, 1 — включено, auto — включено, если вывод осуществляется в терминал.
output_format_pretty_display_footer_column_names
Отображает имена столбцов в нижнем колонтитуле, если в таблице много строк.
Возможные значения:
- 0 — имена столбцов не отображаются в нижнем колонтитуле.
- 1 — имена столбцов отображаются в нижнем колонтитуле, если количество строк больше или равно пороговому значению, заданному настройкой output_format_pretty_display_footer_column_names_min_rows (по умолчанию — 50).
Пример
Запрос:
Результат:
output_format_pretty_display_footer_column_names_min_rows
Устанавливает минимальное количество строк, начиная с которого будет отображаться футер с именами столбцов, если включена настройка output_format_pretty_display_footer_column_names.
output_format_pretty_fallback_to_vertical
Если параметр включён и таблица широкая, но короткая, формат Pretty выведет её так же, как формат Vertical.
См. output_format_pretty_fallback_to_vertical_max_rows_per_chunk и output_format_pretty_fallback_to_vertical_min_table_width для тонкой настройки этого поведения.
output_format_pretty_fallback_to_vertical_max_rows_per_chunk
Переход к формату Vertical (см. output_format_pretty_fallback_to_vertical) будет выполняться только в том случае, если число строк в чанке не превышает указанного значения.
output_format_pretty_fallback_to_vertical_min_columns
Автоматический переход к формату Vertical (см. output_format_pretty_fallback_to_vertical) будет выполняться только в том случае, если количество столбцов превышает указанное значение.
output_format_pretty_fallback_to_vertical_min_table_width
Переход к формату Vertical (см. output_format_pretty_fallback_to_vertical) будет выполняться только в том случае, если суммарная ширина столбцов в таблице не меньше заданного значения или если хотя бы одно значение содержит символ перевода строки.
output_format_pretty_glue_chunks
Если данные, выводимые в форматах Pretty, поступили в нескольких чанках, даже с задержкой, но следующий чанк имеет те же ширины столбцов, что и предыдущий, будут использованы управляющие последовательности ANSI, чтобы вернуться на предыдущую строку и перезаписать футер предыдущего чанка, продолжив его данными нового чанка. Так результат выглядит более аккуратно.
0 — отключено, 1 — включено, 'auto' — включено, если вывод в терминал.
output_format_pretty_grid_charset
Кодировка символов, используемая для отображения границ таблицы. Доступные кодировки: ASCII, UTF-8 (по умолчанию).
output_format_pretty_highlight_digit_groups
Если параметр включён и вывод осуществляется в терминал, каждая цифра в разрядах тысяч, миллионов и т. д. подчёркивается.
output_format_pretty_highlight_trailing_spaces
Если включено и если вывод осуществляется в терминал, подсвечивает пробелы в конце строк серым цветом и подчеркиванием.
output_format_pretty_max_column_name_width_cut_to
Если имя столбца слишком длинное, оно обрезается до этой длины.
Имя столбца будет обрезано, если его длина превышает сумму значений output_format_pretty_max_column_name_width_cut_to и output_format_pretty_max_column_name_width_min_chars_to_cut.
output_format_pretty_max_column_name_width_min_chars_to_cut
Минимальное число символов, на которое укорачивается имя столбца, если оно слишком длинное.
Имя столбца будет укорочено, если его длина превышает output_format_pretty_max_column_name_width_cut_to плюс output_format_pretty_max_column_name_width_min_chars_to_cut.
output_format_pretty_max_column_pad_width
Максимальная ширина, до которой дополняются значения в столбце в форматах Pretty.
output_format_pretty_max_rows
Максимальное количество строк для форматов Pretty.
output_format_pretty_max_value_width
Максимальная длина значения для отображения в форматах Pretty. Если она больше — значение будет обрезано. Значение 0 означает, что обрезка никогда не выполняется.
output_format_pretty_max_value_width_apply_for_single_value
Ограничивать длину значений (см. настройку output_format_pretty_max_value_width) только когда в блоке более одного значения. В противном случае выводить значение полностью, что полезно для запроса SHOW CREATE TABLE.
output_format_pretty_multiline_fields
Если включено, форматы Pretty будут отображать многострочные поля внутри ячейки таблицы, при этом границы таблицы будут сохранены. Если выключено, они будут отображаться как есть, что может деформировать таблицу (одно из преимуществ отключения — более удобное копирование и вставка многострочных значений).
output_format_pretty_row_numbers
Добавляет номера строк перед каждой строкой для формата вывода Pretty
output_format_pretty_single_large_number_tip_threshold
Выводит справа от таблицы подсказку с числом в удобочитаемом виде, если блок состоит из одного числа, которое превышает это значение (кроме 0).
output_format_pretty_squash_consecutive_ms
Ожидать появления следующего блока до указанного количества миллисекунд и объединять его с предыдущим перед выводом. Это позволяет избежать частого вывода слишком маленьких блоков, но при этом по-прежнему отображать данные в потоковом режиме.
output_format_pretty_squash_max_wait_ms
Выводит накопленный блок в форматах pretty, если с момента предыдущего вывода прошло больше указанного количества миллисекунд.
output_format_protobuf_nullables_with_google_wrappers
При сериализации столбцов Nullable с использованием обёрток Google значения по умолчанию сериализуются как пустые обёртки. Если параметр отключён, значения по умолчанию и NULL не сериализуются.
output_format_schema
Путь к файлу, в который будет сохранена автоматически сгенерированная схема в формате Cap'n Proto или Protobuf.
output_format_sql_insert_include_column_names
Включать имена столбцов в запросе INSERT
output_format_sql_insert_max_batch_size
Максимальное количество строк в одном запросе INSERT.
output_format_sql_insert_quote_names
Заключать имена столбцов в символы '`'
output_format_sql_insert_table_name
Имя таблицы в результирующем запросе INSERT
output_format_sql_insert_use_replace
Использовать оператор REPLACE вместо INSERT
output_format_tsv_crlf_end_of_line
Если установлено значение true, строки в формате TSV будут оканчиваться на \r\n вместо \n.
output_format_values_escape_quote_with_quote
Если имеет значение true, символ ' экранируется как '', иначе — как \'.
output_format_write_statistics
Записывает статистику о прочитанных строках, объёме данных (в байтах) и затраченном времени в соответствующих форматах вывода.
Включено по умолчанию
precise_float_parsing
Использовать более точный (но более медленный) алгоритм разбора чисел с плавающей запятой
regexp_dict_allow_hyperscan
Разрешает использование словаря regexp_tree, использующего библиотеку Hyperscan.
regexp_dict_flag_case_insensitive
Использовать сопоставление, нечувствительное к регистру, для словаря regexp_tree. Может быть переопределено в отдельных выражениях с помощью (?i) и (?-i).
regexp_dict_flag_dotall
Разрешает символу «.» совпадать с символами новой строки для словаря regexp_tree.
rows_before_aggregation
Когда он включён, ClickHouse будет предоставлять точное значение статистики rows_before_aggregation — количества строк, прочитанных до агрегации.
schema_inference_hints
Список имён столбцов и их типов, используемых в качестве подсказок при определении схемы для форматов без заданной схемы.
Пример:
Запрос:
Результат:
Если schema_inference_hints имеет неправильный формат или в нём есть опечатка, неверный тип данных и т.п., все значения schema_inference_hints будут проигнорированы.
schema_inference_make_columns_nullable
Определяет, будут ли выводимые типы иметь модификатор Nullable при выводе схемы.
Возможные значения:
- 0 — выводимый тип никогда не будет
Nullable(используйтеinput_format_null_as_default, чтобы контролировать, что делать со значениямиNULLв этом случае), - 1 — все выводимые типы будут
Nullable, - 2 или
auto— выводимый тип будетNullableтолько если столбец содержитNULLв образце данных, который разбирается при выводе схемы, или метаданные файла содержат информацию о допускаемостиNULLдля столбца, - 3 — допускаемость
NULLдля выводимого типа будет соответствовать метаданным файла, если формат их содержит (например, Parquet), и всегда будетNullableв противном случае (например, CSV).
schema_inference_make_json_columns_nullable
Определяет, нужно ли делать выводимые JSON-типы Nullable при выводе схемы.
Если этот параметр включён одновременно с schema_inference_make_columns_nullable, выводимый JSON-тип будет Nullable.
schema_inference_mode
Режим определения схемы. default — предполагается, что все файлы имеют одинаковую схему, и схему можно вывести из любого файла; union — файлы могут иметь разные схемы, и итоговая схема должна представлять собой объединение схем всех файлов.
show_create_query_identifier_quoting_rule
Задает правило заключения идентификаторов в кавычки в запросе SHOW CREATE
show_create_query_identifier_quoting_style
Определяет стиль кавычек для идентификаторов в запросе SHOW CREATE.
type_json_skip_duplicated_paths
При включении во время разбора JSON-объекта в тип JSON дублирующиеся пути будут игнорироваться, и вместо генерации исключения будет использовано только первое значение.
validate_experimental_and_suspicious_types_inside_nested_types
Проверять использование экспериментальных и сомнительных типов внутри вложенных типов, таких как Array/Map/Tuple