Đếm số từ trong tệp bằng lệnh "Wc"

Lệnh "wc" của Linux có thể được sử dụng để cung cấp tổng số từ có trong một tệp. Điều này rất hữu ích nếu bạn đang cố gắng tham gia một cuộc thi đòi hỏi số lượng từ tối đa hoặc nếu bạn là sinh viên có yêu cầu giới hạn từ tối thiểu trên một bài luận.

Trong thực tế, điều này chỉ thực sự hoạt động tốt trên các tệp văn bản nhưng LibreOffice cung cấp tùy chọn "đếm từ" thông qua trình đơn "công cụ" nếu bạn cần số từ từ tài liệu có văn bản đa dạng chẳng hạn như tài liệu Word, tài liệu OpenOffice hoặc tệp văn bản đa dạng.

Cách sử dụng lệnh "wc"

Cách sử dụng cơ bản của lệnh "wc" như sau:

wc

Ví dụ, chúng tôi có một tập tin gọi là test.txt với các nội dung sau:

Tiểu luận của tôi
Chức vụ
Con mèo ngồi trên tấm thảm

Để tìm số từ trong tệp này, chúng ta có thể sử dụng lệnh sau:

wc test.txt

Đầu ra từ lệnh "wc" như sau:

3 9 41 test.txt

Các giá trị như sau:

Nhận tổng số từ đếm từ nhiều tập tin

Bạn có thể cung cấp nhiều tên tệp cho lệnh "wc" như khi bạn nhận được số lượng cho mỗi tệp và một hàng tổng.

Để chứng minh điều này, chúng tôi đã sao chép tệp test.txt và gọi nó là test2.txt. Để có được số lượng từ của cả hai tệp, chúng tôi có thể chạy lệnh sau:

wc test.txt test2.txt

Đầu ra như sau:

3 9 41 test.txt

3 9 41 test2.txt

Tổng số 6 18 82

Như trước số đầu tiên trên mỗi dòng là số dòng, số thứ hai là số đếm từ và số thứ ba là tổng số byte.

Có một công tắc khác có một chút lạ trong tên và thực sự hoạt động theo một cách khá kỳ lạ.

Lệnh này trông như thế này:

wc --files0-from = -

(Đó là số không sau tệp từ)

Khi bạn chạy lệnh trên, bạn sẽ thấy một con trỏ và bạn có thể nhập tên tập tin. Khi bạn đã nhập tên tệp, nhấn CTRL và D hai lần. Điều này sẽ hiển thị tổng số cho tệp đó.

Bây giờ bạn có thể nhập tên tệp khác và nhấn CTRL D hai lần. Điều này sẽ hiển thị tổng số từ tệp thứ hai.

Bạn có thể tiếp tục làm điều này cho đến khi bạn đã có đủ. Nhấn CTRL và C để thoát trở lại dòng lệnh chính.

Lệnh tương tự có thể được sử dụng để tìm số lượng tất cả các từ của tất cả các tệp văn bản trong một thư mục như sau:

tìm thấy . -type f -print0 | wc -l --files0-from = -

Điều này kết hợp lệnh find với lệnh đếm từ. Lệnh find tìm trong thư mục hiện tại (được ký hiệu bởi.) Cho tất cả các tệp với một loại tệp và sau đó in ra tên có một ký tự null được yêu cầu bởi lệnh wc. Lệnh wc lấy đầu vào và xử lý từng tên tệp được trả về bởi lệnh find.

Làm thế nào để hiển thị chỉ tổng số byte trong một tệp

Nếu bạn chỉ muốn đếm số byte trong một tệp, bạn có thể sử dụng lệnh sau:

wc -c

Điều này sẽ trả về tổng số byte và tên tệp.

Cách hiển thị chỉ tổng số ký tự trong một tệp

Số byte thường cao hơn một chút so với tổng số ký tự trong một tệp.

Nếu bạn chỉ muốn tính tổng số ký tự, bạn có thể sử dụng lệnh sau:

wc -m

Đối với tệp test.txt, đầu ra là 39 và không phải là 41 như trước đây.

Cách hiển thị chỉ tổng số dòng trong một tệp

Bạn có thể chạy lệnh sau để chỉ trả về tổng số dòng trong một tệp:

wc -l

Cách hiển thị đường dài nhất trong một tệp

Nếu bạn muốn biết dòng dài nhất trong một tệp, bạn có thể chạy lệnh sau:

wc -L

Nếu bạn chạy lệnh này đối với tệp "test.txt" thì kết quả là 22 tương ứng với số ký tự cho dòng "Con mèo ngồi trên tấm thảm".

Cách hiển thị chỉ tổng số từ trong một tệp

Cuối cùng nhưng không kém phần quan trọng, bạn có thể nhận được tổng số từ trong một tệp bằng cách chạy lệnh sau:

wc -w