描述:
从mysql用sqoop导入hive数据没有丢失,但是两边执行了同样的查询建表语句后,hive数据新表数据丢失了100多条,用sqoop将mysql生成的新表导入查看发现没有丢失数据,难道是hive过程的mr丢失了数据?
再记一个更大的问题:
同样是对tb00005 表统计总数:
select * from tb00005 ORDER BY total desc LIMIT 500;
来自MySQL的结果:
来自hive MR后的结果:
来自sqoop导入MySQL 的 tb00005 的表的结果:
感觉有点严重