“` 利用hash映射,将数据映射到小文件中,取1000为例,然后在各个小文件中进行hashmap统计各个串的出现频数,对应进行快排序或者堆排序,找出每个文件中最大频数的,最后将每个文件中最多的取出再进行快排,得到总的出现最多的字符 “` Was this helpful? YesNo 0 / 0 上一篇: 海量数据分布在100台电脑中,想个办法高效统计出这批数据的top10? 下一篇: 寻找热门查询,300万个查询字符串中统计最热门的10个查询? 发表回复 取消回复0 Your email address will not be published. 在此浏览器中保存我的显示名称、邮箱地址和网站地址,以便下次评论时使用。