Hiveql – вопросы и ответы

64
голоса
1
ответ
Я создаю временную таблицу из другой таблицы, используя предложение AS , где я включаю столбец раздела другой таблицы, также является частью таблицы temp, а затем я получаю следующую ошибку. Ниже п...
4 месяца, 3 недели назад Vimarsh Thusu
63
голоса
1
ответ
У меня есть данные о ТБ на моем складе Hive, я пытаюсь включить их для мгновенного сжатия. Я знаю, что мы можем включить сжатие улья, используя hive> SET hive.exec.compress.output=true; hive>...
4 месяца, 3 недели назад Sushil Ks
64
голоса
1
ответ
У меня есть XML-блок (как показано ниже), хранящийся в таблице журналов улей. <user> <uid>1424324325</uid> <attribs> <field> ... </field> <field> <name&...
4 месяца, 3 недели назад rev
64
голоса
1
ответ
У меня есть пустая секционированная таблица в Hive, и я пытаюсь назвать столбец вместе с порядком столбцов в таблице: > describe formatted test_hive; имя_компьютера data_type col1 date col2 stri...
4 месяца, 3 недели назад Shanil
63
голоса
1
ответ
Я хотел бы знать, имеет ли порядок записей данных (с точки зрения производительности) при объединении двух таблиц? PS Я не использую какое-либо присоединение к карте или объединение в bucket. Спасибо!
4 месяца, 3 недели назад James
248
голосов
16
ответов
Я установил свой куст как указано в ссылке: http://www.youtube.com/watch?v=Dqo1ahdBK_A , но при создании таблицы в Hive я получаю следующую ошибку. Я использую hasoop-1.2.1 и hive-0.12.0. hive> ...
4 месяца, 3 недели назад Raju Sharma
63
голоса
1
ответ
Я загружаю свои журналы с S3 в Hive с помощью CREATE TABLE logs( 'col1' struct<'country':string,'page':string,'date':string> ) ROW FORMAT SERDE 'org.openx.data.jsonserde.JsonSerDe' LOCATION '...
4 месяца, 3 недели назад user2635060
-4
голоса
1
ответ
У меня две таблицы old_table и new_table. Они отличаются только числом строк. Я wana удаляю old_table, если количество строк меньше, чем new_table. Как я могу это использовать? В улье или как сцена...
4 месяца, 3 недели назад DrSD
62
голоса
1
ответ
jan 18 "value1 is null" feb 4 "value1 is null" в приведенном выше наборе данных есть последовательные разделители между 1-м и 2-м столбцами во второй строке, как обрабатывать последовательные разде...
4 месяца, 3 недели назад Mohan M
63
голоса
2
ответа
Я пытаюсь вставить данные ниже в таблицу улей: John Doe ^ A100000.0 ^ AMary Smith ^ BTodd Jones ^ Налоговые налоги ^ C.2 ^ BState Taxes ^ C.05 ^ BInsurance ^ C.1 ^ A1 Мичиганский пр. ^ BChicago ^ B...
4 месяца, 3 недели назад Aman
88
голосов
1
ответ
У меня есть таблица улей со следующими столбцами session Timestamp 1 2018-05-18T00:00:00.000Z 1 2018-05-18T00:01:00.000Z 1 2018-05-18T00:02:00.000Z 1 2018-05-18T00:03:00.000Z 2 2018-05-18T00:05:00....
4 месяца, 3 недели назад Hardik gupta
63
голоса
2
ответа
У меня очень странное поведение с моим кластером, я запускаю команду "Удалить/обновить" в Hive cli, которая когда-то работает нормально, а некоторое время не работает, это Command. Таблица ACID вкл...
4 месяца, 3 недели назад Anupam Alok
99
голосов
4
ответа
Представьте таблицу с одним столбцом. +------+ | v | +------+ |0.1234| |0.8923| |0.5221| +------+ Я хочу сделать следующее для строки K: Возьмите строку K = 1 значение: 0.1234 Укажите, сколько знач...
4 месяца, 3 недели назад JRG
63
голоса
1
ответ
Как бы изменилось regexp_extract, если эти данные были в столбце с именем "страницы", и я хочу, чтобы для каждой строки, которая имеет: old: yes:, чтобы вернуть строку после "да" и до следующей стр...
4 месяца, 3 недели назад Sarah
99
голосов
2
ответа
Я использую spring-jdbc template для запроса Hive-0.11.0 . Следующий код хорошо работает. public List<Student> listStudents() { String SQL = "select * from Student"; List <Student> stud...
4 месяца, 3 недели назад srikanth
62
голоса
1
ответ
Я пытаюсь выполнить статический раздел куста, основанный на делении записей сотрудников, когда я выполняю команду загрузки для вставки данных в свою секционированную таблицу, он меняет все значение...
4 месяца, 3 недели назад adithyan .p
88
голосов
1
ответ
Я пытаюсь sumif в SQL и получать точный результат, но он показывает все остальное. Например: select brand, sum(if(channel = 'A' and brand in ('001', '002'), orderz, 0)) as conv1 from data.sumifs wh...
4 месяца, 3 недели назад RashItIs
132
голоса
1
ответ
Я пытаюсь сделать несколько вложенных подзапросов. Сначала найдите строчные имена с ролью "Человек", а затем найдите session_ids которые были у этих людей. С этим списком session ids я хочу отфильт...
4 месяца, 3 недели назад Matt W.
109
голосов
1
ответ
Я создал одну таблицу в кусте из существующего файла S3 следующим образом: create table reconTable ( entryid string, run_date string ) LOCATION 's3://abhishek_data/dump1'; Теперь я хотел бы обновит...
4 месяца, 3 недели назад Joy
88
голосов
1
ответ
У меня есть файл журнала, и первым столбцом будет мой раздел в таблице Hive. logSchemaRDD.registerTempTable("logs") hiveContext.sql("insert overwrite table logs_parquet PARTITION(create_date=select...
4 месяца, 3 недели назад sophie
135
голосов
1
ответ
может кто-нибудь дать мне знать, как исправить недостающие реплики? =============================================== ============================= Общий размер: 3447348383 B Всего dirs: 120 Всего фа...
4 месяца, 3 недели назад Raj
63
голоса
1
ответ
Привет, я пытаюсь вывести внешнее соединение на таблицу на другой, соответствующие столбцы - это тип String. Will Hive присоединяется к совпадению столбцов строки или их нужно преобразовать в друго...
4 месяца, 3 недели назад Ravi Shastri
-4
голоса
1
ответ
Я вставлял перезапись на внешнюю таблицу. Я вижу новые данные в базовом местоположении, указанном внешней таблицей. Но таблица по-прежнему показывает старые данные. По моим сведениям, внешняя табли...
4 месяца, 3 недели назад kalpesh
110
голосов
1
ответ
Я пишу запрос, который должен иметь значение GROUP BY по типу строки и делить значение на общую сумму, чтобы узнать% от общего числа в IMPALA. Напр.: Name performance something type1 something 15 s...
4 месяца, 3 недели назад Alex Rubl Patsula
90
голосов
1
ответ
У меня есть следующая структура таблицы в Hive, Date ID x1 x1_value x2 x2_value 2018-09-17 1 a 10 b 20 2018-09-17 2 b 20 c 30 Я хочу преобразовать это, Date ID x x_value 2018-09-17 1 a
4 месяца, 3 недели назад haimen
62
голоса
1
ответ
У меня есть запрос HiveQL, который выглядит примерно так: SELECT ID, CASE WHEN col_a = 0 THEN 0 ELSE (col_b / col_a) END AS math_is_fun FROM (/* derived query*/) AS x ; Когда я выполняю это в Hive,...
4 месяца, 3 недели назад Jeremiah Peschka
108
голосов
1
ответ
Предположим, у вас есть две внешние таблицы ORC Hive. Оба они имеют одну и ту же схему с одинаковыми типами данных, одинаковыми разделами и одинаковыми ведрами. Я пытаюсь удалить таблицу A и устано...
4 месяца, 3 недели назад conner.xyz
63
голоса
2
ответа
Пусть у меня есть таблица с именем "Таблица1", имеющая столбцы и значения, как показано ниже --------------------------- action | component | type | --------------------------- 1 | 2 | 1 | 2 | 3 | ...
4 месяца, 3 недели назад CodingOwl
64
голоса
3
ответа
Я пытаюсь запустить несколько подзапросов в предложение where, и я получаю ошибку ниже. Означает ли это, что Hive не поддерживает его? Если нет, существует ли другой способ написать запрос ниже? Пр...
4 месяца, 3 недели назад sharp
77
голосов
2
ответа
У меня есть таблица в Hive, которая генерируется чтением из файла последовательности в моей HDFS. Эти файлы последовательности являются json и выглядят так: {"Activity":"Started","CustomerName":"Cu...
4 месяца, 3 недели назад cold1ce
-4
голоса
1
ответ
Я попробовал этот запрос Hive Select id,count(distinct CASE WHEN unix_timestamp(m_date) BETWEEN unix_timestamp(cast(date_sub(cast('2017-02-01' as date),60) as date)) AND unix_timestamp(cast('2017-0...
4 месяца, 3 недели назад Indy McCarthy
64
голоса
1
ответ
Я хочу создать внешнюю таблицу Hive из текстового файла, содержащего эпоху в HDFS. Скажем, файл находится в /user/me/test.txt . Здесь содержимое файла: 1354183921 1354183922 У меня установлен Hive ...
4 месяца, 4 недели назад darcyq
63
голоса
1
ответ
Я столкнулся с одной проблемой при преобразовании даты в улей. Мне нужно преобразовать 2017-sep-12 в 2017-09-12. Как я могу достичь этого в HIVE
4 месяца, 4 недели назад BigD
63
голоса
1
ответ
Я столкнулся с проблемой, когда я использую инструкцию select в настраиваемой внешней таблице, которую я создал. Я добавил разделы в эту таблицу после создания таблицы год и день с помощью команды ...
4 месяца, 4 недели назад Manoj Sreekumar
108
голосов
1
ответ
У меня есть сценарий - с использованием файла данных утилиты [с таким же именем каждый раз - после удаления старого файла, а затем загрузки обновленного/последнего файла] из системы источника в HDF...
4 месяца, 4 недели назад Chauhan B
63
голоса
1
ответ
У меня есть таблица, которая выглядит так: start_timestamp end_timestamp 2012-11-18 05:53:36.0 2012-11-18 7:46:40.0 2012-11-18 06:34:23.0 2012-12-18 09:21:57.0 И я хочу, чтобы результат выглядел та...
5 месяцев назад Danny David Leybzon
134
голоса
1
ответ
У меня есть таблица Hive foo . В этой таблице есть несколько полей. Один из них - some_id . Количество уникальных значений в этих полях в диапазоне 5000-10 000. Для каждого значения (в примере это ...
5 месяцев назад Loom
63
голоса
1
ответ
В Mysql мы можем использовать DO sleep(5) ; сделать паузу. Но это не сработало в Улье. Есть ли функция сна в Улье?
5 месяцев назад Frank.Chang
63
голоса
2
ответа
Например, у меня есть следующая таблица с именем Roll: ID Name Address --------------------- 01 Lily NewYork 02 Lucy NewYork 03 Lucy NewYork и я хочу получить COUNT (1) GROUP BY комбинацией столбца...
5 месяцев назад Po Zhou
117
голосов
1
ответ
Я пытаюсь решить эту проблему для UDF, созданного для среды hiveql. public ObjectInspector initialize(ObjectInspector[] arguments) throws UDFArgumentException { if (arguments.length != 1) { throw n...
5 месяцев назад LSG
Чтобы , пожалуйста,
Выберите тему жалобы:

Другая проблема