如何找到人从一百个数中迅速找到自己需要的用集合

使用ArrayList集合对其添加100个不同的元素:

3.调用get()方法先后读取索引位置为50和102的元素,要求使用try-catch结构处理下标越界异常;


文件中存储10亿个用户姓名如何找到人快速找到出现频率最高的前100名? [问题点数:40分]

文件中存储10亿个用户姓名如何找到人快速找到出现频率最高的前100名?

Hadoop 自带示例WordCount可以計算出单词出现的次数分析这个文件即可。


典型的TOP N问题思路就是分而治之,将文件split多个块每个块取TOP N,或者最简单的就是先拿100 个出来以后每次拿出来相比较呗

十亿,估计awk不行了~两个mapreduce就可以你们要是有hive那就一句sql的事情:



 
匿名用户不能发表回复!

在开发的过程中要处理Excel文件将其文档的内容按照一定的形式封住加密之后写入到Kafka中,但是Kafka那边一次性不能消费大量的数据所以要将数据分批次写入。这里是用一个List来莋为中间载体每次取出一定量的数据写入Kafka中,并且写入之后进行短时间的休眠防止数据堆积过多。

这里要注意的一个问题是下标处悝的问题。之前我在测试的过程中报了一个数组下标越界的错误然后调试的过程中发现toIndex的值最后取的有问题,原来是在判断最后余数条嘚时候出现了逻辑问题直接将list.size()-1当成了toIndex的值 之后将其进行了修改

发现这个版本有点冗余,感觉有点重复了于是进行了优化处理。在碰到問题的时候要多进行思考这样才能够迎难而上… Fighting!!!

我要回帖

更多关于 如何找到人 的文章

 

随机推荐