Giả sử bạn đang huấn luyện mô hình phân loại hay gì đó, và bạn muốn chia train/test nhưng lại muốn dữ liệu của bạn có phân phối ngẫu nhiên. Khi đó, bạn có thể trộn ngẫu nhiên vị trí các dòng trong file.
Trong trường hợp bạn có nhiều hơn 1 file, bạn vừa muốn gộp thành 1 file và đồng thời xáo trộn dữ liệu, thì hãy dùng:
cat file1 file2 | shuf
Hoặc sử dụng sort command như sau:
# -R, --random-sort
# sort by random hash of keys
$ sort -R filename
# Nhiều file
$ sort -R file1 file2