hive排序后collect_set

tomson 2020-05-27

假设存在表格如下：

select ‘a‘ as category, 19 as duration
union all
select ‘b‘ as category, 15 as duration
union all
select ‘c‘ as category, 12 as duration
union all
select ‘d‘ as category, 53 as duration
union all
select ‘e‘ as category, 27 as duration
union all
select ‘f‘ as category, 9  as duration;

 category | duration 
 b        |       15 
 f        |       9 
 e        |       27 
 c        |       12 
 d        |       53 
 a        |       19

想要多行转一行并且按照duration排序，形成如下效果d,e,a,b,c,f

首先排序：row_number() over (partition by category order by cast(duration as int) desc) duration_rank，然后拼接concat_ws(‘,‘,collect_set(category))，但是得到的结果却是乱序的，产生这个问题的根本原因自然在MapReduce，如果启动了多于一个mapper/reducer来处理数据，select出来的数据顺序就几乎肯定与原始顺序不同了。

解决方法可以把mapper数固定成1，或者把rank加进来再进行一次排序，拼接完之后把rank去掉：

select 
regexp_replace(    
 concat_ws(‘,‘,
   sort_array(
     collect_list(
       concat_ws(‘:‘,lpad(cast(duration_rank as string),5,‘0‘),cast(category as string))
     )
   )
 ),
‘\\d+\:‘,‘‘)
from 
(select 
category
,row_number() over (order by cast(duration as int) desc) duration_rank 
from 
(select ‘a‘ as category, 19 as duration
union all
select ‘b‘ as category, 15 as duration
union all
select ‘c‘ as category, 12 as duration
union all
select ‘d‘ as category, 53 as duration
union all
select ‘e‘ as category, 27 as duration
union all
select ‘f‘ as category, 9 as duration) t
) T;

duration_rank 必须要在高位补足够的0对齐，因为排序的是字符串而不是数字，如果不补0的话，按字典序排序就会变成1, 10, 11, 12, 13, 2, 3, 4...，又不对了。将排序的结果拼起来之后，用regexp_replace函数替换掉冒号及其前面的数字，大功告成。

: tomson

相关推荐

Golang 定时器(Timer 和 Ticker),这篇文章就够了

Golang 原生 time 包下可以用来执行一些定时任务或者是周期性的任务的一个工具。本文基于 Go 1.14，如果以下文章有哪里不对或者问题的地方，欢迎讨论学习。定时器的日常使用。timer.Stop() // 这里来提高 timer 的回收。tCha

专注前端开发 0喜欢 / 0评论 2020-10-21

Mysql 实现字段拼接的三个函数

给运营导出数据时，难免需要对字段进行拼接，如果 Mysql 可以完成的话，就可以少些很多代码。不过如果有字段值为 NULL，则结果为 NULL。上面这种方式如果想要使用分隔符分割，就需要每个字段中间插一个字符串，非常麻烦。concat_ws() 可以一次性

苏康申 0喜欢 / 0评论 2020-11-13

详解 MySQL中count函数的正确使用方法

当搞清楚count函数的运行原理后，相信上面几个问题的答案就会了然于胸。为了解决上述的问题，我创建了一张 user 表，它有两个字段：主键id和name，后者可以为null，建表语句如下。`id` int NOT NULL AUTO_INCREMENT C

vitasfly 0喜欢 / 0评论 2020-11-12

oracle锁表该如何解决

where l.object_id　=　o.object_id and l.session_id=s.sid;如果杀不掉可以加个 immediate 立即杀掉试试；如果利用上面的命令杀死一个进程后，进程状态被置为"killed"，但是

oraclemch 0喜欢 / 0评论 2020-11-06

SQL Server如何通过创建临时表遍历更新数据详解

前段时间新项目上线为了赶进度很多模块的功能都没有经过详细的测试导致了生成环境中的数据和实际数据对不上，因此需要自己手写一个数据库脚本来更新下之前的数据。关于数据统计汇总的问题肯定会用到遍历统计汇总，那么问题来了数据库中如何遍历呢？好像并没有for和fore

liuyang000 0喜欢 / 0评论 2020-09-25

ThinkPHP5 链式操作table用法

table方法主要用于指定操作的数据表。用法一般情况下，操作模型的时候系统能够自动识别当前对应的数据表，所以，使用table方法的情况通常是为了：。需要注意的是table方法不会改变数据库的连接，所以你要确保当前连接的用户有权限操作相应的数据库和数据表。切

FellowYourHeart 0喜欢 / 0评论 2020-10-05

sql注入 --显错注入

jiong 0喜欢 / 0评论 2020-09-17

Orcle11G创建表空间，创建用户，授权等操作

CREATE USER caiyl IDENTIFIED BY 123456 DEFAULT TABLESPACE caiyl_space;GRANT CREATE USER,DROP USER,ALTER USER ,CREATE ANY VIEW ,A

赵继业 0喜欢 / 0评论 2020-08-17

SQL 创建、更新和删除视图的方法

视图是可视化的表。本章讲解如何创建、更新和删除视图。视图包含行和列，就像一个真实的表。您可以向视图添加 SQL 函数、WHERE 以及 JOIN 语句，也可以呈现数据，就像这些数据来自于某个单一的表一样。视图 "Current Product L

whyname 0喜欢 / 0评论 2020-08-16

oracle 日期操作语句总结

SELECT TO_CHAR AS YEAR FROM DUAL--查询当前年份。SELECT TO_CHAR AS MONTH FROM DUAL--获取当前日期的'YYYY/MM/DD'格式：2020/01/02. SELECT TO_CHAR AS

Seandba 0喜欢 / 0评论 2020-08-16

ORACLE数据库中Rownum用法详解

ORACLE 中ROWNUM用法总结!对于 Oracle 的 rownum 问题，很多资料都说不支持>,>=,=,between...and，只能用以上符号(<、<=、!=)，并非说用>,& gt;=,=,betwee

dbasunny 0喜欢 / 0评论 2020-08-16

MySQL如何创建视图

可以使用 CREATE VIEW 语句来创建视图。该名称在数据库中必须是唯一的，不能与其他表或视图同名。用户除了拥有 CREATE VIEW 权限外，还具有操作中涉及的基础表和其他视图的相关权限。SELECT 语句不能包含 FROM 子句中的子查询。可使用

拼命工作好好玩 0喜欢 / 0评论 2020-08-15

详细分析mysql视图的原理及使用方法

在MySQL中，视图可能是我们最常用的数据库对象之一了。那么你知道视图和表的区别吗？可能很多人对视图只是一知半解，想详细了解视图的同学看过来哟，本篇文章会详细介绍视图的概念、创建及使用方法。当我们创建一个视图的时候，实际上是在数据库里执行了SELECT语句

langyue 0喜欢 / 0评论 2020-08-15

MySQL约束

分别查询男、女同学的平均分,人数要求：分数低于70分的人，不参与分组,分组之后。

好记忆也需烂 0喜欢 / 0评论 2020-08-15

MySQL实现根据当前ID读取上一条和下一条记录

SELECT * FROM A WHERE ID < 5 ORDER BY ID DESC LIMIT 0,1; ps: select * from table1 where id<$id order by iddesc limit

写程序的赵童鞋 0喜欢 / 0评论 2020-08-03

mysql 14 覆盖索引+回表

MySQL可以利用索引返回select列表中的字段值。而不必根据主键再次读取聚簇索引数据文件查到数据，也就是平时所说的不需要回表操作。覆盖索引其实是索引覆盖的意思，索引字段就已经囊括select查询的字段，即索引字段覆盖了需查询的字段。t; 即id是聚集索

Accpcjg 0喜欢 / 0评论 2020-08-02

go语言中——select的使用方法

早期的select函数是用来监控一系列的文件句柄，一旦其中一个文件句柄发生IO操作，该select调用就会被返回。golang在语言级别直接支持select，用于处理异步IO问题。可以看出，ch初始化后，case1读取失败，timeout同样失败，因为ch

tydldd 0喜欢 / 0评论 2020-07-30

Mysql入门 DML语句大全DML、DDL、DCL

Mysql 数据库语句 1、说明：创建数据库CREATE DATABASE database-name2、说明：删除数据库drop database dbname3、说明：备份sql server--- 创建备份数据的 deviceUSE masterE

好记忆也需烂 0喜欢 / 0评论 2020-07-28

fiddler相关命令的使用

bps 后边跟的是 HTTP 状态码，表示中断所有为该状态码的会话。将所有的会话打包成 .zip 压缩包的形式保存到 C 盘根目录下。比如 urlreplace baidu fishc 表示将所有 URL 的 baidu 替换成 fishc。select

jianghero 0喜欢 / 0评论 2020-07-28

Selenium 获取Select元素的选中值

obj_select = Select #强制类型转换为Select类型

Reiki 0喜欢 / 0评论 2020-07-28

MySQL基础之MySQL必知必会(十六)创建高级联结

MariaDB [crashcourse]> SELECT cust_name, cust_contact FROM customers AS c, orders AS o, orderitems AS oi WHERE c.cust_id=o.cu

variab 0喜欢 / 0评论 2020-07-28

（傲娇的白狐）mybatis一对多及多对一

测试环境导入lombok新建实体类Teacher，Student新建Mapper接口建立Mapper.XML文件在核心配置文件中绑定注册我们的MApper接口或者文件！测试查询是否成功！按照查询嵌套处理<!--思路： 1、查询所有的学生信息

xiuyangsong 0喜欢 / 0评论 2020-07-26

mysql中group by优化

如果需要对关联查询做分组，并且按照关联表中的某个列进行分组，那么通常采用关联表的标识列分组的效率比其他列更高：。select actor.first_name,actor.last_name,count(*) from film_actor inner j

gsmfan 0喜欢 / 0评论 2020-07-26

第21课使用游标

有时，需要在检索出来的行中前进或后退一行或多行，这就是游标的用途所在。游标是一个存储在DBMS服务器上的数据库查询，它不是一条SELECT语句，而是被该语句检索出来的结果集。在存储了游标之后，应用程序可以根据需要滚动或浏览其中的数据。一旦声明，就必须打开游

ztyzly00 0喜欢 / 0评论 2020-07-21

Mybatis实现增删改查

承接上一篇《我的第一个mybatis程序》，继续增加增删改查部分的内容。在mybatis环境搭建完成之后，原来的需要的jdbc工作也差不多算是被mybatis框架替代了，我们只需要编写少量的代码就可以实现对数据库的操作。--namespace=绑定一个对应

Dullonjiang 0喜欢 / 0评论 2020-07-19

Mysql用户权限管理

create user ‘新用户名‘@‘localhost‘ identified by ‘密码‘;grant all privileges on 数据库名.表名 to ‘新用户名‘@‘指定ip‘ identified by ‘新用户密码‘ ;

sunysh00 0喜欢 / 0评论 2020-07-18

Mybatis模糊查询

select * from video where point=#{point} and title like concat

Dullonjiang 0喜欢 / 0评论 2020-07-08

问题：xcrun: error: invalid active developer path

解决：安装xcode-select. # xcode-select --install

LuckyDeng 0喜欢 / 0评论 2020-07-08

sql优化的几种方式

= 或 <> 操作符不会使用索引，而对于 < 、 <= 、 = 、 > 、 >= 、 BETWEEN AND，数据库才会使用索引。因此对于上面的查询，正确写法应该是：select name from table wher

明月清风精进不止 0喜欢 / 0评论 2020-07-05

MYSQL 优化常用方法

这个技术可以使用SELECT语句来创建一个单列的查询结果，然后把这个结果作为过滤条件用在另一个查询中。在客户端的查询会话结束的时候，临时表会被自动删除，从而保证数据库整齐、高效。换句话说，就是可以保持数据库中数据的一致性和完整性。事物以BEGIN 关键字开

FORYAOSHUYUN 0喜欢 / 0评论 2020-07-05

SQL语句优化的理解

然后是某一条SQL 语句一直执行的很慢，可能的原因有没有用到索引，例如该字段没有索引；由于对字段进行运算、函数操作导致无法用索引，或者是数据库选错了索引。这种情况是我们要关心的，需要进行SQL语句的优化，简单来说就是该用索引就要用索引，避免全表扫描。

URML 0喜欢 / 0评论 2020-07-04

python爬虫beautifulsoup查找定位Select用法

<p class="story">Once upon a time there were three little sisters; and their names were. 我们在写 CSS 时，标签名不加任何修饰，类名

Dimples 0喜欢 / 0评论 2020-06-28

SQL 性能优化技巧 part1

如果 IN 的参数是这样的值列表时，没啥问题，但如果参数是子查询时，就需要注意了。现在我们要查出同时存在于两个表的员工，即田中和铃木，则以下用 IN 和 EXISTS 返回的结果是一样，但是用 EXISTS 的 SQL 会更快：。如果使用 EXISTS，那

ItBJLan 0喜欢 / 0评论 2020-06-28

Mysql语法及部分实例 2020-6-28

sql通用语法：1.语句以单行或多行书写，以分号结束2.MySql数据库不区分大小写，但是关键字建议大写查询数据库的字符集：show create database 数据库名；创建数据库指定字符集：show database if not exists t

BiPerler 0喜欢 / 0评论 2020-06-28

SQLSERVER删除所有的表、存储过程和视图

select‘alter table [‘+ object_name+‘] drop constraint [‘+name+‘]; ‘。select @tname=‘drop table ‘+ left. declare v_mycur cursor lo

zhaojp0 0喜欢 / 0评论 2020-06-27

MySQL数据库之WHERE条件语句

WHERE语句用于检索符合相关条件的数据，；搜索的条件可以由一个或者多个表达式组成；请注意，我们在例子中的条件值周围使用的是单引号。如果是数值，请不要使用引号。SELECT * FROM Persons WHERE FirstName=‘Bush‘

xiaoxiangyu 0喜欢 / 0评论 2020-06-26

记MySQL网课

数据库的相关概念。前身属于瑞典的一家公司，MySQL AB

林大鹏 0喜欢 / 0评论 2020-06-26

mysql语法

显示当前mysql的version的各种信息。如，增加一个用户user1密码为password1，让其可以在本机上登录，并对所有数据库有查询、插入、修改、删除的权限。首先用以root用户连入mysql，然后键入以下命令：。如果希望该用户能够在任何机器上登

hxw0 0喜欢 / 0评论 2020-06-26

MySQL之三引擎、视图、锁、事务

mysql> HELP DROP VIEWSyntax:DROP VIEW [IF EXISTS]view_name [, view_name] ... [RESTRICT | CASCADE]　。mysql> CREATE VIEW t

msmysql 0喜欢 / 0评论 2020-06-26

oracle 授予权限和收回权限 grant和revoke 以及角色的创建删除

ALLON数据对象名,SELECTON数据对象名,UPDATEON数据对象名,DELETEON数据对象名,INSERTON数据对象名,--用户授权GRANTCONNECT,RESOURCETO用户名;GRANTSELECTON表名TO用户名;GRANTSE

娜娜 0喜欢 / 0评论 2020-06-22

ajax将数据遍历给select的option选项

<select name="type" id="typeId"> <option>请选择</option> </select>js：

李永毅 0喜欢 / 0评论 2020-06-21

SQL 语言包括哪几部分？每部分都有哪些操作关键字？

SQL 语言包括数据定义、数据操纵,数据控制和数据查询四个部分。

ItBJLan 0喜欢 / 0评论 2020-06-21

SQL 语法：一些最重要的 SQL 命令简介

一个数据库通常包含一个或多个表。每个表有一个名字标识,表包含带有数据的记录（行）。在本教程中，我们在 MySQL 数据库中创建了 Websites 表，用于存储网站记录。| id | name | url

CSDN0BLOG 0喜欢 / 0评论 2020-06-21

MySQL优化之索引篇: Explain工具

explain专门用来做SQL语句的调优的，在select语句前面加一个explain可以把SELECT的执行过程都列出来，包括哪些用了索引，哪些没用索引，哪些查询是全表查询，哪些是索引查询等 . 使用效果如下图 :. 执行编号，标识select所属的行。

minggehenhao 0喜欢 / 0评论 2020-06-21

SQL 的服务器端编程---T-SQL简介

Transact-SQL 的缩写为T-SQL，T-SQL是Microsoft 公司的SQL Server的数据库语言，它是对标准SQL语言的扩充。数据库中的数据通常需要定义一个数据类型,不同DBMS具体支持的数据类型大体相同，稍有差异，具体可参阅相关手册。

goodriver 0喜欢 / 0评论 2020-06-17

SQL获取汉字首字母函数

--如果非汉字字符，返回原字符。set @+(case when unicode(@word) between 19968 and 19968+20901. select ‘A‘ as PY,N‘驁‘ as word. union all select ‘

ItBJLan 0喜欢 / 0评论 2020-06-16

element -ui select下拉框label显示多个值

placeholder="请选择优惠券类型"

sixthelement 0喜欢 / 0评论 2020-06-16

shell case命令

值可以为变量或常数。注意模式1)模式2) *) 都有一个右括号。每个模式结束后用双分号结束;;4|5) echo ‘You select 4 or 5‘

luobotoutou 0喜欢 / 0评论 2020-06-16

SQL Server：SQL Like 通配符特殊用法：Escape

最后，看一个更加复杂的匹配，注意“-”这个也是特殊字符也需转义。下面这个就是要匹配包括“纺梦”这两个字，但这两个字只能是与“+-*/”这四个字符相连或是单独存在。如果这里的“纺梦”是任意中文字符就没办法去处理了。

xuanlvhaoshao 0喜欢 / 0评论 2020-06-16

mysql的高级进阶（一）

我们将我们的客户端的编码设置为utf8，客户端和客户端连接设为utf8，表设计为utf8，字段设置成utf8。如果我们的客户端是gbk的编码，那我们就通知mysql服务器客户端和客户端连接是gbk的就行了。这样也不会出现乱码。存储过程是为了完成特定功能的s

hungzz 0喜欢 / 0评论 2020-06-16