Làm thế nào để tính đến các công trình đã xuất bản và các trích dẫn trong sách nghiên cứu. Tự động tạo và chỉnh sửa danh sách các nguồn đã sử dụng bằng Mendeley O2 để thêm bài viết của bạn

  • 11.12.2021

Danh sách các nguồn đã sử dụng phải được sử dụng khá thường xuyên. Sinh viên viết các bài báo học kỳ và bằng tốt nghiệp, sinh viên đại học, nghiên cứu sinh và nghiên cứu sinh viết luận án. Các nhà nghiên cứu viết các bài báo và báo cáo và nhiều hơn nữa. Tôi chắc chắn rằng mỗi độc giả ít nhất một lần trong đời phải lập một danh sách tài liệu tham khảo và chỉ ra tài liệu tham khảo trong văn bản.

Khi tạo một bài báo trên Web, bạn có thể chèn các siêu liên kết đến các nguồn trực tiếp trong văn bản hoặc thêm một danh sách có dấu đầu dòng ở chân trang, trong đó các nguồn này và mọi tài liệu nên đọc sẽ không được liệt kê theo thứ tự cụ thể. Tuy nhiên, trong cộng đồng khoa học và trong hệ thống giáo dục, các yêu cầu nghiêm ngặt (và đôi khi mâu thuẫn) được đặt ra đối với quy tắc lập danh sách như vậy, mà theo cách thủ công, là một công việc buồn tẻ và vô nghĩa.
Trong bài viết này, tôi sẽ chia sẻ kinh nghiệm của tôi trong việc tự động hóa danh sách các nguồn được trích dẫn bằng Mendeley. Khi soạn thảo văn bản, tôi sử dụng MS Word 2007 vì chủ nhân của tôi đã mua nó tốt hơn. Tất cả những điều sau đây có thể được lặp lại trong Open Office.

Tại sao các công cụ thư mục tích hợp của MS Word lại làm tôi không hài lòng?

Trên thực tế, bắt đầu từ phiên bản 2007, MS Word có một cơ chế tích hợp để tạo danh sách tài liệu tham khảo, thậm chí còn hỗ trợ (được cho là) ​​GOST.

Về lý thuyết, mọi thứ đều đơn giản - bạn nhập tất cả tài liệu đã sử dụng vào cơ sở dữ liệu và sau đó liên kết với nó khi cần. Đặt một danh sách ở cuối tài liệu. Các liên kết ở định dạng chính xác sẽ nằm rải rác trong văn bản. Nhưng trong thực tế, mọi thứ phức tạp hơn. Đầu tiên, người dùng cần nhập tất cả các nguồn tài liệu được sử dụng bằng cách điền vào tất cả các trường của biểu mẫu.

Nộp cả chục tác phẩm là một khối lượng công việc không hề nhỏ. Điền vào cơ sở dữ liệu hàng trăm mục - nguy cơ suy nhược thần kinh. Vì lý do nào đó, tôi tìm kiếm trong cơ sở dữ liệu không tìm thấy bất cứ thứ gì đáng giá đối với tôi. Tuy nhiên, tất cả công việc vẫn sẽ vô ích, vì mẫu tích hợp khác xa với GOST. Thậm chí không có dấu ngoặc vuông khét tiếng. Tuy nhiên, vấn đề cuối cùng có thể được chữa khỏi bằng cách chỉnh sửa mẫu.

Vì vậy, những gì không phù hợp với tôi trong Word:

Mendeley hoạt động như thế này: bạn tạo tài khoản, tải xuống và cài đặt phần mềm cũng như khởi động cơ sở dữ liệu thẻ nguồn của riêng bạn. Việc tải xuống và cài đặt plugin cho MS Word (hoặc Open Office) cũng rất hữu ích.


Thêm liên kết đến tài liệu bằng cách sử dụng plugin cho MS Word

Bạn cũng có thể sử dụng trình cắm của trình duyệt để đôi khi thêm các nguồn tìm thấy trên Internet dễ dàng hơn.

Bằng cách kéo và thả một đối tượng được tìm thấy trên mạng, bạn có thể nhận được một thẻ làm sẵn trong Mendeley. Và bạn có thể không nhận được nó. Trong mọi trường hợp - hãy chỉnh sửa rất cẩn thận các thẻ nhận được bằng cách sử dụng plugin trong trình duyệt.

Sau khi cài đặt phiên bản dành cho máy tính để bàn hoặc đăng nhập vào tài khoản của mình thông qua trình duyệt, bạn có thể sử dụng tính năng tìm kiếm trong cơ sở dữ liệu của các thẻ đã được tạo. Đúng vậy, việc tìm kiếm trên thực tế không hoạt động với các ấn phẩm bằng tiếng Nga, nhưng nó hầu như luôn tìm thấy tài liệu nước ngoài và hiếm khi cần phải nhập thủ công. Bạn có thể tự thêm và chỉnh sửa thẻ tìm thấy trên mạng (nên kiểm tra thẻ của người khác để tìm lỗi và điền không đầy đủ - Tôi đã gặp những thẻ chứa đầy những người lười biếng không chú ý. Trong mọi trường hợp, chỉnh sửa thẻ đã hoàn thành dễ hơn điền mọi thứ bản thân bạn).


Ảnh chụp màn hình Mendeley Decktop trong quá trình hoạt động

Tuy nhiên, ngay cả khi tìm kiếm trong cơ sở dữ liệu nội bộ của Mendeley không mang lại kết quả nào, bạn cũng không nên vội vàng điền thẻ theo cách thủ công. Chúng tôi đến Học viện Google và cố gắng tìm nguồn bắt buộc ở đó. Nếu nguồn được tìm thấy, thì chúng tôi tìm thấy bên dưới nó liên kết "Nhập vào BibTeX", lưu đối tượng từ liên kết dưới dạng tệp và mở nó bằng chương trình Mendeley Desktop. Theo quy định, chúng tôi nhận được một thẻ nguồn đã được lấp đầy một nửa. Việc chỉnh sửa thẻ như vậy dễ dàng hơn là điền thủ công.


Ví dụ về cách bạn có thể tải tệp BibTeX tạo sẵn thông qua Học viện Google

Đối với các mẫu để định dạng liên kết và bản thân thư mục, ngoài số lượng lớn các mẫu đã được cài đặt theo mặc định, bạn có thể thêm mẫu của riêng mình. Các mẫu này không được viết ngẫu nhiên, mà bằng một "ngôn ngữ kiểu trích dẫn" Ngôn ngữ kiểu trích dẫn (CSL) đặc biệt, dựa trên XML.

Tôi sẽ không cung cấp liên kết đến các mẫu cụ thể mà tôi sử dụng trong công việc của mình, vì tôi không chắc liệu chúng có thành công nhất hay không. Tôi sẽ chỉ nói rằng yêu cầu của các nhà xuất bản khoa học Nga, nhà xuất bản nước ngoài, hội đồng chấm luận văn, vân vân và vân vân là khác nhau đáng kể, nhưng cho đến nay tôi vẫn có thể tìm được một bản mẫu tốt cho từng loại.

Thuật toán chung để sử dụng hệ thống Mendeley

  1. Đăng ký, tải phần mềm, cài đặt plugin
  2. Chúng tôi tạo các thư mục cần thiết (ví dụ: "Giáo trình", "Văn bằng", "Báo cáo khoa học", v.v.) theo ý muốn
  3. Chúng tôi đang tìm kiếm tài liệu cần thiết trong tìm kiếm và kéo các thẻ cần thiết vào thư mục của chúng tôi
  4. Nếu không tìm thấy thứ gì đó trong Mendeley, chúng tôi tìm kiếm trong Google hoặc nơi khác, mở tệp BibTeX đã lưu và thêm vào thư mục của chúng tôi
  5. Chúng tôi kiểm tra tính đúng đắn của các thẻ được tìm thấy
  6. Nếu không tìm thấy gì ở bất kỳ đâu, chúng tôi tạo một thẻ mới và điền vào thủ công, nếu muốn / cần thiết, hãy đính kèm tệp của chính bài viết đó
  7. Chúng tôi mở văn bản của công việc tương lai của chúng tôi trong MS Word / Open Office và thêm liên kết vào đúng vị trí, chọn mẫu định dạng danh sách và thêm danh sách nguồn vào cuối tài liệu
  8. Chúng tôi xem xét cẩn thận danh sách các nguồn kết quả. Nếu có vấn đề gì xảy ra, hãy chỉnh sửa thẻ nguồn hoặc chỉnh sửa / loại bỏ mẫu và tìm / viết một mẫu mới
  9. Chúng tôi hài lòng với kết quả
Theo quy định, các nguồn giống nhau có thể được sử dụng trong các bài báo khác nhau, trong một luận văn, báo cáo khoa học, v.v. Khi bạn thêm nó vào hồ sơ của mình, bạn sẽ nhận được một liên kết đến nó trong một vài cú nhấp chuột.

Mendeley với tư cách là Trợ lý tìm kiếm văn học

Ngoài việc tạo thư mục nhanh chóng và dễ dàng, Mendeley còn giúp tìm kiếm tài liệu bằng cách cho phép bạn tìm “các bài báo liên quan”, cũng như tìm kiếm theo tác giả, từ khóa, v.v.

Hoàn thành hồ sơ Mendeley ngụ ý một loại trang web mạng xã hội dành cho học giả. Ngoài ra còn có khả năng làm việc nhóm, nhưng cho đến nay tôi vẫn chưa thể thuyết phục đồng nghiệp sử dụng hệ thống này (có thể bài viết này sẽ giúp ích) nên không có kinh nghiệm làm việc như vậy.

Mendeley cho phép bạn không chỉ lưu trữ dữ liệu thư mục của các bài báo và phần tóm tắt của chúng, mà còn đính kèm các tệp pdf với toàn văn. Và cũng có thể tải xuống phiên bản toàn văn của những bài báo mà các thành viên khác của hệ thống đã cung cấp cho công chúng.

Bạn có thể nghiên cứu chức năng và giao diện của hệ thống với sự trợ giúp của các video đào tạo và một video được viết tốt (mặc dù bằng tiếng Anh).

Các tính năng hữu ích khác của Mendeley

  • Sự hiện diện của một trình cắm thêm cho Open Office (Cá nhân tôi chưa thử nghiệm chức năng của nó)
  • Khả năng tùy chỉnh linh hoạt nhiều thứ bên cạnh kiểu thư mục (ví dụ: thứ tự lưu trữ tệp trên đĩa)
  • Khả năng tích hợp với các hệ thống tương tự, chủ yếu là Zatero
  • Bạn có thể lưu trữ thẻ của các ấn phẩm của riêng bạn và hy vọng rằng những người dùng khác của hệ thống sẽ tìm thấy chúng khi tìm kiếm từ khóa, sử dụng, liên kết và tăng chỉ số trích dẫn của bạn.
  • Có một phiên bản của Mendeley Desktop không chỉ dành cho Windows mà còn dành cho Linux và MacOS
  • Có một ứng dụng di động cho iPhone
  • API đã xuất bản

Nhược điểm của Mendeley

Một số thiếu sót có thể được gọi là "tính năng", nhưng tôi sẽ không sử dụng thủ thuật này.
  • Tìm kiếm tài liệu không hoạt động với các nguồn tiếng Nga (hãy sẵn sàng nhập chúng theo cách thủ công)
  • Ngay cả phiên bản dành cho máy tính để bàn cũng yêu cầu kết nối internet. Chế độ ngoại tuyến không được cung cấp
  • Bạn cần đăng ký, tạo tài khoản và làm việc với nó
  • Nếu tài liệu của bạn chứa liên kết đến 100 nguồn tài liệu trở lên và bạn đã thực hiện chỉnh sửa (đã thêm một nguồn khác, mở liên kết để chỉnh sửa), hãy sẵn sàng cho việc chạy chậm lại một chút trong MS Word
  • Khả năng của một tài khoản miễn phí bị giới hạn: dung lượng lưu trữ cho các phiên bản toàn văn của bài báo, số lượng nhóm làm việc và số lượng thành viên nhóm. (Tuy nhiên, tôi không đính kèm tệp pdf vào tất cả các bài báo mà tôi làm việc và tôi giữ riêng hầu hết chúng, điều này cho phép bạn thoải mái sử dụng tài khoản miễn phí)
  • Không có ứng dụng nào dành cho Android và các nền tảng di động không phải của apple khác

Sự kết luận

Mendeley có thể hữu ích cho sinh viên đại học, nghiên cứu sinh, nhà nghiên cứu và nói chung là bất kỳ ai. Dành một chút thời gian để học hệ thống này có thể giúp bạn tiết kiệm rất nhiều căng thẳng khi làm việc với thư mục, đặc biệt là khi bạn phải hoán đổi hai phần phụ của một tài liệu đã được kiểm tra cẩn thận và hệ thống đánh số tham chiếu được làm sạch bằng tay của bạn trở nên lãng phí.

Bài viết này không nhằm mục đích tổng quan đầy đủ và toàn diện về hệ thống Mendeley và chỉ nhằm thu hút sự chú ý của các bên quan tâm đến việc sử dụng các công cụ tự động hóa đó. Cá nhân tác giả biết nhiều nhà khoa học lỗi lạc (kể cả những người thuộc lĩnh vực khoa học kỹ thuật) vẫn dành thời gian quý báu để tự tay biên soạn danh mục tài liệu tham khảo.

Và cho chúng tôi biết về lỗi bạn nhận thấy.

Khi nào tôi có thể xem bài báo trên trang web, theo yêu cầu của tôi, mà tôi đã rời đi?

Cố gắng đáp ứng tất cả các yêu cầu của bạn, chúng tôi có quyền chọn những gì thú vị nhất và nguyên bản nhất trong số đó. Nếu chúng tôi tìm thấy câu trả lời cho câu hỏi của bạn, thì chúng tôi sẽ đăng nó trên trang web. Hãy theo dõi các bản cập nhật trên trang web. Bạn cũng có thể tìm kiếm thông qua Tìm kiếm trên trang web.

Làm thế nào để thêm hình đại diện của bạn?

Đăng ký một người dùng trên trang web.
Sau đó đăng nhập vào Hồ sơ của bạn.
Trong trường Hình đại diện, nhấp vào Duyệt qua, chọn ảnh hoặc ảnh của bạn.
Nhập mật khẩu và mã của bạn được hiển thị trong hình vào trường bên dưới, sau đó nhấp vào nút Lưu thay đổi.

Tôi muốn đặt nút của bạn trên trang web của tôi, làm thế nào tôi có thể làm điều đó?

Chúng tôi sẽ biết ơn bạn vì điều này!
Đây là mã cho nút:

Trang web có RSS không?
Làm thế nào để tìm kiếm trên trang KnowKak.ru?

Việc tìm kiếm được thực hiện bằng các thẻ được gán cho các bài báo. Do đó, không cần thiết phải nhập đầy đủ tên của vật liệu - hoặc các cụm từ của vật liệu đó. Chọn một từ khóa duy nhất cho tài liệu mong muốn, ví dụ: "tinh dầu" - khi tìm kiếm một gói tinh dầu, "bóng đá" - khi tìm kiếm bất kỳ tài liệu nào về bóng đá, v.v. Sau đó, xóa phần cuối khỏi từ khóa - để loại trừ trường hợp , thời gian, chi (trên thực tế, chỉ để lại gốc), - trong trường hợp của chúng tôi, chẳng hạn, nó sẽ thành: "dầu" và "bóng đá", hoặc "sô-cô-la" (từ sô-cô-la), "vận chuyển" (từ phương tiện giao thông ), "thu nhập" (từ thu nhập), v.v. Nhập từ viết tắt này vào trường tìm kiếm và bạn sẽ tìm thấy nó. Bạn có thể giảm số lượng kết quả tìm kiếm bằng cách sử dụng hai hoặc ba từ khóa bị cắt ngắn như vậy, chẳng hạn như "tinh dầu", nhưng hãy nhớ rằng trong trường hợp này, bạn có thể bỏ lỡ một số bài báo có liên quan đến sở thích của bạn, vì các thẻ trong sau này có thể không được đặt trong phần bổ sung đầy đủ. Nhưng hãy nhớ rằng trong các trường hợp khác nhau, phần cuối của một số từ có thể thay đổi đáng kể, do đó, ví dụ, đối với từ viết tắt "oil", bạn có thể không tìm thấy các bài báo có thẻ "dầu" (Ai? Cái gì?). Do đó, đừng quên kiểm tra tất cả các tùy chọn có thể. Điều quan trọng không kém là một số chủ đề có thể được gọi theo cách khác nhau: "Cách tổ chức một bữa tiệc" hoặc "Làm thế nào để vui chơi với bạn bè vào năm mới" - trên thực tế, chúng là một và những điều giống nhau. Vì vậy, hãy nghĩ về tên thay thế mà tài liệu bạn quan tâm có thể có.

Công cụ tìm kiếm của Google (www.google.com) cung cấp nhiều tùy chọn tìm kiếm. Tất cả những khả năng này là một công cụ tìm kiếm vô giá đối với người dùng Internet lần đầu, đồng thời, là vũ khí xâm lược và hủy diệt thậm chí còn mạnh hơn trong tay những kẻ có ý đồ xấu xa, bao gồm không chỉ tin tặc mà còn cả những người phi máy tính. tội phạm và thậm chí khủng bố.
(9475 lượt xem trong 1 tuần)

Denis Batrankov
denisNOSPAMixi.ru

Chú ý:Bài viết này không phải là một hướng dẫn để hành động. Bài viết này được viết cho bạn, những quản trị viên của máy chủ WEB, để bạn mất đi cảm giác sai lầm rằng bạn đang an toàn và cuối cùng bạn hiểu được sự xảo quyệt của phương pháp thu thập thông tin và thiết lập về việc bảo vệ trang web của bạn.

Giới thiệu

Ví dụ, tôi tìm thấy 1670 trang trong 0,14 giây!

2. Hãy giới thiệu một dòng khác, ví dụ:

inurl: "auth_user_file.txt"

ít hơn một chút, nhưng điều này đã đủ để tải xuống miễn phí và cho các cuộc tấn công bạo lực (sử dụng cùng một John The Ripper). Dưới đây tôi sẽ đưa ra thêm một số ví dụ.

Vì vậy, bạn cần nhận ra rằng công cụ tìm kiếm Google đã truy cập hầu hết các trang web trên Internet và lưu trữ trong bộ nhớ cache thông tin chúng chứa. Thông tin được lưu trong bộ nhớ cache này cho phép bạn lấy thông tin về trang web và nội dung của trang web mà không cần kết nối trực tiếp đến trang web, chỉ cần đào sâu vào thông tin được lưu trữ bên trong Google. Hơn nữa, nếu thông tin trên trang web không còn nữa, thì thông tin trong bộ nhớ đệm có thể vẫn được giữ nguyên. Tất cả những gì cần thiết cho phương pháp này là biết một số từ khóa của Google. Kỹ thuật này được gọi là Google Hacking.

Lần đầu tiên, thông tin về Google Hacking xuất hiện trong danh sách gửi thư của Bugtruck cách đây 3 năm. Năm 2001, chủ đề này được đưa ra bởi một sinh viên người Pháp. Đây là liên kết đến bức thư này http://www.cotse.com/mailing-lists/bugtraq/2001/Nov/0129.html. Nó cung cấp các ví dụ đầu tiên về các truy vấn như vậy:

1) Chỉ mục của / quản trị viên
2) Chỉ mục của / mật khẩu
3) Chỉ mục của / mail
4) Chỉ mục của / + banques + loại tệp: xls (cho Pháp ...)
5) Chỉ mục của / + mật khẩu
6) Chỉ mục của / password.txt

Chủ đề này đã gây chú ý trong phần đọc tiếng Anh trên Internet gần đây: sau khi bài báo của Johnny Long được xuất bản vào ngày 7 tháng 5 năm 2004. Để có nghiên cứu đầy đủ hơn về Google Hacking, tôi khuyên bạn nên truy cập trang web của tác giả này tại http://johnny.ihackstuff.com. Trong bài viết này, tôi chỉ muốn cập nhật cho bạn.

Ai có thể sử dụng nó:
- Các nhà báo, điệp viên và tất cả những người thích chĩa mũi dùi vào các vấn đề khác có thể sử dụng điều này để tìm kiếm bằng chứng thỏa hiệp.
- Tin tặc đang tìm kiếm mục tiêu phù hợp để hack.

Cách thức hoạt động của Google.

Để tiếp tục cuộc trò chuyện, hãy để tôi nhắc bạn về một số từ khóa được sử dụng trong các truy vấn của Google.

Tìm kiếm bằng dấu +

Theo ý kiến ​​của mình, Google loại trừ khỏi tìm kiếm những từ không quan trọng. Ví dụ, các từ nghi vấn, giới từ và mạo từ trong tiếng Anh: ví dụ are, of, where. Trong tiếng Nga, Google dường như coi tất cả các từ đều quan trọng. Nếu từ đó bị loại trừ khỏi tìm kiếm, thì Google sẽ viết về từ đó. Để Google bắt đầu tìm kiếm các trang có những từ này phía trước chúng, bạn cần thêm dấu + không có khoảng trắng trước từ đó. Ví dụ:

ace + của bazơ

Tìm kiếm bằng ký hiệu -

Nếu Google tìm thấy một số lượng lớn các trang mà từ đó cần loại trừ các trang có chủ đề cụ thể, thì bạn có thể buộc Google chỉ tìm kiếm các trang không có từ cụ thể. Để làm điều này, bạn cần chỉ ra những từ này, đặt trước mỗi dấu hiệu - không có khoảng trắng trước từ đó. Ví dụ:

vodka câu cá

Tìm kiếm bằng ~

Bạn có thể muốn tìm không chỉ từ được chỉ định, mà còn cả từ đồng nghĩa của nó. Để làm điều này, hãy đặt trước từ bằng ký hiệu ~.

Tìm cụm từ chính xác bằng cách sử dụng dấu ngoặc kép

Google tìm kiếm trên mỗi trang cho tất cả các lần xuất hiện của các từ mà bạn đã viết trong chuỗi truy vấn và nó không quan tâm đến vị trí tương đối của các từ, điều chính là tất cả các từ được chỉ định đều có trên trang cùng một lúc (điều này là hành động mặc định). Để tìm cụm từ chính xác, bạn cần đặt nó trong dấu ngoặc kép. Ví dụ:

"bookend"

Để có ít nhất một trong các từ được chỉ định, bạn cần chỉ định hoạt động logic một cách rõ ràng: HOẶC. Ví dụ:

sách an toàn HOẶC bảo vệ

Ngoài ra, trên thanh tìm kiếm, bạn có thể sử dụng dấu * để biểu thị bất kỳ từ nào và. để biểu thị bất kỳ ký tự nào.

Tìm từ bằng cách sử dụng các toán tử bổ sung

Có các toán tử tìm kiếm được chỉ định trong chuỗi tìm kiếm ở định dạng:

toán tử: search_term

Dấu cách bên cạnh dấu hai chấm là không cần thiết. Nếu bạn chèn khoảng trắng sau dấu hai chấm, bạn sẽ thấy thông báo lỗi và trước dấu hai chấm, Google sẽ sử dụng chúng như một chuỗi tìm kiếm bình thường.
Có các nhóm toán tử tìm kiếm bổ sung: ngôn ngữ - cho biết bạn muốn xem kết quả bằng ngôn ngữ nào, ngày - giới hạn kết quả trong ba, sáu hoặc 12 tháng qua, số lần xuất hiện - cho biết vị trí trong tài liệu bạn cần tìm kiếm string: ở khắp mọi nơi, trong tiêu đề, trong URL, các miền - tìm kiếm trang web được chỉ định hoặc ngược lại, loại trừ nó khỏi tìm kiếm, tìm kiếm an toàn - chặn các trang web chứa loại thông tin được chỉ định và xóa chúng khỏi các trang kết quả tìm kiếm.
Đồng thời, một số toán tử không cần tham số bổ sung, ví dụ: yêu cầu " cache: www.google.com"có thể được gọi là một chuỗi tìm kiếm chính thức và ngược lại, một số từ khóa yêu cầu một từ tìm kiếm" site: www.google.com trợ giúp". Theo chủ đề của chúng ta, chúng ta hãy xem xét các toán tử sau:

Nhà điều hành

Sự miêu tả

Yêu cầu một tham số bổ sung?

chỉ tìm kiếm trên trang web được chỉ định trong search_term

chỉ tìm kiếm trong các tài liệu có loại search_term

tìm các trang chứa search_term trong tiêu đề

tìm các trang chứa tất cả các từ search_term trong tiêu đề

tìm các trang có chứa từ search_term trong url của chúng

tìm các trang chứa tất cả các từ search_term trong url của chúng

Nhà điều hành Địa điểm: chỉ giới hạn tìm kiếm trong trang web được chỉ định và bạn có thể chỉ định không chỉ tên miền mà còn cả địa chỉ IP. Ví dụ: nhập:

Nhà điều hành loại tệp: hạn chế các tìm kiếm đối với các tệp thuộc một loại cụ thể. Ví dụ:

Kể từ ngày phát hành bài báo, Google có thể tìm kiếm trong 13 định dạng tệp khác nhau:

  • Định dạng tài liệu di động của Adobe (pdf)
  • Adobe PostScript (ps)
  • Lotus 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku)
  • Lotus WordPro (lwp)
  • MacWrite (mw)
  • Microsoft Excel (xls)
  • Microsoft PowerPoint (ppt)
  • Microsoft Word (doc)
  • Microsoft Works (tuần, tuần, wdb)
  • Microsoft Write (wri)
  • Định dạng văn bản đa dạng thức (rtf)
  • Shockwave Flash (swf)
  • Văn bản (ans, txt)

Nhà điều hành liên kết: hiển thị tất cả các trang trỏ đến trang được chỉ định.
Có lẽ luôn thú vị khi xem có bao nhiêu nơi trên Internet biết về bạn. Cố gắng:

Nhà điều hành bộ nhớ đệm: hiển thị phiên bản của trang web trong bộ nhớ cache của Google giống như khi Google truy cập trang này lần cuối. Chúng tôi xem xét bất kỳ trang web nào thường xuyên thay đổi và xem xét:

Nhà điều hành intitle: tìm kiếm từ được chỉ định trong tiêu đề trang. Nhà điều hành allintitle: là một phần mở rộng - nó tìm kiếm tất cả các từ được chỉ định trong tiêu đề trang. Đối chiếu:

intitle: chuyến bay đến sao hỏa
intitle: chuyến bay intitle: đến intitle: mars
allintitle: chuyến bay đến sao hỏa

Nhà điều hành inurl: buộc Google phải hiển thị tất cả các trang có chứa chuỗi được chỉ định trong URL. Toán tử allinurl: Tìm kiếm tất cả các từ trong một URL. Ví dụ:

allinurl: axit acid_stat_alerts.php

Lệnh này đặc biệt hữu ích cho những người không có SNORT - ít nhất họ có thể thấy nó hoạt động như thế nào trên một hệ thống thực.

Các phương pháp lấy cắp dữ liệu sử dụng Google

Vì vậy, chúng tôi phát hiện ra rằng sử dụng kết hợp các toán tử và từ khóa ở trên, bất kỳ ai cũng có thể bắt đầu thu thập thông tin cần thiết và tìm kiếm các lỗ hổng. Những kỹ thuật này thường được gọi là Google Hacking.

bản đồ trang web

Bạn có thể sử dụng toán tử site: để xem tất cả các liên kết mà Google tìm thấy trên trang web. Thông thường, các trang được tạo động bằng tập lệnh không được lập chỉ mục bằng cách sử dụng các tham số, vì vậy một số trang sử dụng bộ lọc ISAPI để các liên kết không ở dạng /article.asp?num=10&dst=5 và có dấu gạch chéo / article / abc / num / 10 / dst / 5... Điều này được thực hiện để trang web thường được lập chỉ mục bởi các công cụ tìm kiếm.

Hãy thử:

site: www.whitehouse.gov whitehouse

Google cho rằng mọi trang trên trang web đều chứa từ whitehouse. Đây là những gì chúng tôi sử dụng để lấy tất cả các trang.
Ngoài ra còn có một phiên bản đơn giản hóa:

site: whitehouse.gov

Và điều tuyệt vời nhất là những người bạn từ whitehouse.gov thậm chí còn không biết rằng chúng tôi đã xem xét cấu trúc trang web của họ và thậm chí còn xem xét các trang được lưu trong bộ nhớ cache mà Google đã tải xuống cho chính nó. Điều này có thể được sử dụng để nghiên cứu cấu trúc của các trang web và xem nội dung mà không bị chú ý vào lúc này.

Xem danh sách các tệp trong thư mục

Máy chủ WEB có thể hiển thị danh sách các thư mục máy chủ thay vì các trang HTML thông thường. Điều này thường được thực hiện để người dùng chọn và tải xuống các tệp cụ thể. Tuy nhiên, trong nhiều trường hợp, quản trị viên không có mục tiêu hiển thị nội dung của một thư mục. Điều này xảy ra do cấu hình máy chủ không chính xác hoặc không có trang chính trong thư mục. Do đó, hacker có cơ hội tìm thấy thứ gì đó thú vị trong danh bạ và sử dụng nó cho mục đích riêng của mình. Để tìm tất cả các trang như vậy, chỉ cần lưu ý rằng tất cả chúng đều chứa các từ: chỉ mục của trong tiêu đề của chúng. Nhưng vì chỉ mục từ của không chỉ chứa các trang như vậy, chúng tôi cần phải làm rõ truy vấn và tính đến các từ khóa trên chính trang đó, do đó, các truy vấn có dạng phù hợp với chúng tôi:

intitle: index.of thư mục mẹ
intitle: index.of kích thước tên

Vì hầu hết các danh sách thư mục là có chủ ý, bạn có thể khó tìm thấy danh sách sai sót trong lần đầu tiên. Nhưng ít nhất bạn đã có thể sử dụng danh sách để xác định phiên bản của máy chủ WEB, như được mô tả bên dưới.

Lấy phiên bản của máy chủ WEB.

Biết phiên bản của máy chủ WEB luôn hữu ích trước khi bắt đầu bất kỳ cuộc tấn công nào của hacker. Một lần nữa, nhờ có Google, bạn có thể lấy thông tin này mà không cần kết nối với máy chủ. Nếu bạn nhìn kỹ vào danh sách của thư mục, bạn có thể thấy rằng tên của máy chủ WEB và phiên bản của nó được hiển thị ở đó.

Apache1.3.29 - Máy chủ ProXad tại cổng trf296.free.fr 80

Quản trị viên có kinh nghiệm có thể thay đổi thông tin này, nhưng theo quy luật, nó là đúng. Vì vậy, để có được thông tin này, chỉ cần gửi một yêu cầu:

intitle: index.of server.at

Để nhận thông tin cho một máy chủ cụ thể, chúng tôi làm rõ yêu cầu:

intitle: index.of server.at site: ibm.com

Hoặc ngược lại, chúng tôi đang tìm kiếm các máy chủ chạy trên một phiên bản máy chủ cụ thể:

intitle: index.of Apache / 2.0.40 Server tại

Kỹ thuật này có thể được sử dụng bởi một hacker để tìm một nạn nhân. Ví dụ: nếu anh ta có một khai thác cho một phiên bản nhất định của máy chủ WEB, thì anh ta có thể tìm thấy nó và thử khai thác hiện có.

Bạn cũng có thể lấy phiên bản máy chủ bằng cách xem các trang được cài đặt theo mặc định khi cài đặt phiên bản mới của máy chủ WEB. Ví dụ: để xem trang kiểm tra Apache 1.2.6, chỉ cần nhập

intitle: Test.Page.for.Apache it.worked!

Hơn nữa, một số hệ điều hành ngay lập tức cài đặt và chạy máy chủ WEB trong quá trình cài đặt. Đồng thời, một số người dùng thậm chí không nhận thức được điều này. Đương nhiên, nếu bạn thấy ai đó chưa xóa trang mặc định, thì hợp lý là bạn cho rằng máy tính đó chưa trải qua bất kỳ cấu hình nào và rất có thể dễ bị tấn công.

Cố gắng tìm các trang IIS 5.0

allintitle: Chào mừng bạn đến với Windows 2000 Internet Services

Trong trường hợp IIS, bạn không chỉ có thể xác định phiên bản máy chủ mà còn cả phiên bản Windows và Gói dịch vụ.

Một cách khác để xác định phiên bản của máy chủ WEB là tìm kiếm sách hướng dẫn (trang trợ giúp) và các ví dụ có thể được cài đặt trên trang web theo mặc định. Tin tặc đã tìm ra nhiều cách để sử dụng các thành phần này để có được quyền truy cập đặc quyền vào một trang web. Đó là lý do tại sao bạn cần loại bỏ các thành phần này trên nơi sản xuất. Chưa kể thực tế là bằng sự hiện diện của các thành phần này, bạn có thể nhận được thông tin về loại máy chủ và phiên bản của nó. Ví dụ, hãy tìm hướng dẫn sử dụng apache:

inurl: mô-đun chỉ thị apache thủ công

Sử dụng Google như một máy quét CGI.

Máy quét CGI hoặc máy quét WEB là một tiện ích để tìm kiếm các tập lệnh và chương trình dễ bị tấn công trên máy chủ của nạn nhân. Các tiện ích này nên biết những gì cần tìm, vì chúng có danh sách toàn bộ các tệp dễ bị tấn công, ví dụ:

/cgi-bin/cgiemail/uargg.txt
/random_banner/index.cgi
/random_banner/index.cgi
/cgi-bin/mailview.cgi
/cgi-bin/maillist.cgi
/cgi-bin/userreg.cgi

/iissamples/ISSamples/SQLQHit.asp
/SiteServer/admin/findvserver.asp
/scripts/cphost.dll
/cgi-bin/finger.cgi

Chúng tôi có thể tìm thấy từng tệp này bằng cách sử dụng Google, sử dụng các từ chỉ mục của hoặc inurl ngoài tên tệp trong thanh tìm kiếm: chúng tôi có thể tìm thấy các trang web có tập lệnh dễ bị tấn công, ví dụ:

allinurl: /random_banner/index.cgi

Sử dụng kiến ​​thức bổ sung, tin tặc có thể khai thác lỗ hổng tập lệnh và sử dụng lỗ hổng này để buộc tập lệnh trả lại bất kỳ tệp nào được lưu trữ trên máy chủ. Ví dụ một tệp mật khẩu.

Cách bảo vệ bạn khỏi bị tấn công Google.

1. Không đăng dữ liệu quan trọng lên máy chủ WEB.

Ngay cả khi bạn đã đăng dữ liệu tạm thời, sau đó bạn có thể quên nó hoặc ai đó sẽ có thời gian để tìm và lấy dữ liệu này trước khi bạn xóa nó. Đừng làm vậy. Có nhiều cách khác để truyền dữ liệu để bảo vệ dữ liệu khỏi bị đánh cắp.

2. Kiểm tra trang web của bạn.

Sử dụng các phương pháp được mô tả để nghiên cứu trang web của bạn. Kiểm tra trang web của bạn theo định kỳ bằng các phương pháp mới xuất hiện trên trang http://johnny.ihackstuff.com. Hãy nhớ rằng nếu bạn muốn tự động hóa các hành động của mình, bạn cần được Google cho phép đặc biệt. Nếu bạn đọc kỹ http://www.google.com/terms_of_service.html thì bạn sẽ thấy cụm từ: Bạn không được gửi các truy vấn tự động dưới bất kỳ hình thức nào tới hệ thống của Google mà không có sự cho phép trước của Google.

3. Bạn có thể không cần Google lập chỉ mục trang web của bạn hoặc một phần của nó.

Google cho phép bạn xóa một liên kết đến trang web của bạn hoặc một phần của nó khỏi cơ sở dữ liệu của nó, cũng như xóa các trang khỏi bộ nhớ cache. Ngoài ra, bạn có thể cấm tìm kiếm hình ảnh trên trang web của mình, cấm hiển thị các đoạn trang ngắn trong kết quả tìm kiếm. Tất cả các tùy chọn để xóa một trang web đều được mô tả trên trang http://www.google.com.vn/remove.html... Để làm điều này, bạn phải xác nhận rằng bạn thực sự là chủ sở hữu của trang web này hoặc chèn thẻ vào trang hoặc

4. Sử dụng robots.txt

Được biết, các công cụ tìm kiếm nhìn vào tệp robots.txt nằm ở thư mục gốc của trang web và không lập chỉ mục những phần được đánh dấu bằng từ Không cho phép... Bạn có thể tận dụng điều này để ngăn một phần của trang web được lập chỉ mục. Ví dụ: để tránh lập chỉ mục toàn bộ trang web, hãy tạo tệp robots.txt chứa hai dòng:

Đại lý người dùng: *
Không cho phép: /

Điều gì khác xảy ra

Vì vậy, cuộc sống dường như không giống như mật ong đối với bạn, cuối cùng tôi sẽ nói rằng có những trang web theo dõi những người, sử dụng các phương pháp trên, đang tìm kiếm lỗ hổng trong tập lệnh và máy chủ WEB. Một ví dụ về một trang như vậy là

Ruột thừa.

Một chút ngọt ngào. Hãy tự mình thử điều gì đó từ danh sách sau:

1. #mysql dump filetype: sql - tìm kết xuất của cơ sở dữ liệu mySQL
2. Báo cáo tóm tắt về lỗ hổng bảo mật trên máy chủ - sẽ cho bạn thấy những lỗ hổng mà người khác đã tìm thấy
3.phpMyAdmin chạy trên inurl: main.php - điều này sẽ buộc kiểm soát đóng thông qua bảng điều khiển phpmyadmin
4. không để phân phối bí mật
5. Chi tiết yêu cầu Biến máy chủ cây điều khiển
6. Chạy ở chế độ Trẻ em
7. Báo cáo này được tạo bởi WebLog
8.intitle: index.of cgiirc.config
9.filetype: conf inurl: firewall -intitle: cvs - có ai cần tệp cấu hình tường lửa không? :)
10. intitle: index.of Finance.xls - hmm….
11.intitle: Chỉ mục của các cuộc trò chuyện dbconvert.exe - nhật ký trò chuyện icq
12.intext: Phân tích lưu lượng truy cập Tobias Oetiker
13.intitle: Thống kê sử dụng do Webalizer tạo
14.intitle: thống kê các thống kê web nâng cao
15.intitle: index.of ws_ftp.ini - cấu hình ws ftp
16.inurl: ipsec.secrets nắm giữ những bí mật được chia sẻ - chìa khóa bí mật là một tìm kiếm tốt
17.inurl: main.php Chào mừng đến với phpMyAdmin
18.inurl: server-info Thông tin máy chủ Apache
19. trang web: điểm quản trị edu
20. ORA-00921: kết thúc bất ngờ của lệnh SQL - nhận đường dẫn
21. intitle: index.of trillian.ini
22. intitle: Chỉ mục của pwd.db
23. intitle: index.of people.lst
24. intitle: index.of master.passwd
25. inurl: passlist.txt
26. intitle: Chỉ mục của .mysql_history
27. intitle: chỉ mục của intext: dropsals.inc
28. intitle: index.of administrator.pwd
29. intitle: Index.of vv bóng
30. intitle: index.of secring.pgp
31.inurl: config.php dbuname dbpass
32. inurl: thực hiện loại tệp: ini

  • "Hacking mit Google"
  • Trung tâm đào tạo "Informzashita" http://www.itsecurity.ru - trung tâm chuyên ngành hàng đầu trong lĩnh vực đào tạo về an toàn thông tin (Giấy phép của Ủy ban giáo dục Moscow số 015470, công nhận của nhà nước số 004251). Trung tâm đào tạo được ủy quyền duy nhất về Hệ thống An ninh Internet và Clearswift ở Nga và CIS. Trung tâm Đào tạo Ủy quyền của Microsoft (Chuyên ngành bảo mật). Các chương trình đào tạo được phối hợp với Ủy ban Kỹ thuật Nhà nước của Nga, FSB (FAPSI). Chứng chỉ đào tạo và các văn bản của nhà nước về phát triển nghề nghiệp.

    SoftKey là một dịch vụ duy nhất dành cho người mua, nhà phát triển, đại lý và đối tác liên kết. Ngoài ra, đây là một trong những cửa hàng phần mềm trực tuyến tốt nhất ở Nga, Ukraine, Kazakhstan, cung cấp cho khách hàng nhiều chủng loại, nhiều phương thức thanh toán, xử lý đơn hàng nhanh chóng (thường là tức thì), theo dõi quá trình hoàn thành đơn hàng trong phần cá nhân, nhiều chiết khấu từ cửa hàng và nhà sản xuất BẬT.

    Lấy dữ liệu riêng tư không phải lúc nào cũng có nghĩa là bị hack - đôi khi nó được cung cấp công khai. Biết các cài đặt của Google và một chút khéo léo sẽ cho phép bạn tìm thấy rất nhiều điều thú vị - từ số thẻ tín dụng đến tài liệu FBI.

    CẢNH BÁO

    Tất cả thông tin chỉ được cung cấp cho mục đích thông tin. Ban biên tập và tác giả đều không chịu trách nhiệm về bất kỳ tác hại nào có thể xảy ra do các tài liệu của bài viết này gây ra.

    Ngày nay, mọi thứ đều được kết nối với Internet, ít quan tâm đến việc hạn chế quyền truy cập. Do đó, rất nhiều dữ liệu riêng tư trở thành miếng mồi ngon của các công cụ tìm kiếm. Robot nhện không còn giới hạn trong các trang web, mà lập chỉ mục tất cả nội dung có sẵn trên Web và liên tục thêm thông tin không công khai vào cơ sở dữ liệu của chúng. Tìm ra những bí mật này rất dễ dàng - bạn chỉ cần biết chính xác cách hỏi về chúng.

    Tìm kiếm tệp

    Trong tầm tay phù hợp, Google sẽ nhanh chóng tìm thấy mọi thứ xấu trên Web - ví dụ: thông tin cá nhân và tệp để sử dụng chính thức. Chúng thường được ẩn, giống như một chiếc chìa khóa dưới tấm thảm: không có giới hạn truy cập thực sự, dữ liệu chỉ nằm ở sân sau của trang web, nơi các liên kết không dẫn đến. Giao diện web tiêu chuẩn của Google chỉ cung cấp các cài đặt tìm kiếm nâng cao cơ bản, nhưng ngay cả những cài đặt đó cũng đủ.

    Bạn có thể sử dụng hai toán tử để giới hạn tìm kiếm của mình cho các loại tệp cụ thể trên Google bằng cách sử dụng loại tệp và số nhánh. Đầu tiên chỉ định định dạng mà công cụ tìm kiếm xác định bởi tiêu đề tệp, thứ hai - phần mở rộng tệp, bất kể nội dung bên trong của nó. Khi tìm kiếm trong cả hai trường hợp, bạn chỉ cần chỉ định phần mở rộng. Ban đầu, toán tử ext rất thuận tiện để sử dụng trong trường hợp tệp không có các tính năng định dạng cụ thể (ví dụ: để tìm kiếm tệp cấu hình ini và cfg, bên trong có thể có bất kỳ thứ gì). Giờ đây, các thuật toán của Google đã thay đổi và không có sự khác biệt rõ ràng giữa các toán tử - kết quả trong hầu hết các trường hợp đều giống nhau.


    Lọc vấn đề

    Theo mặc định, Google tìm kiếm các từ và nói chung, mọi ký tự đã nhập trong tất cả các tệp trên các trang được lập chỉ mục. Bạn có thể giới hạn phạm vi tìm kiếm theo tên miền cấp cao nhất, một trang web cụ thể hoặc theo vị trí của chuỗi mong muốn trong chính các tệp. Đối với hai tùy chọn đầu tiên, trang web điều hành được sử dụng, tiếp theo là tên miền hoặc trang web đã chọn. Trong trường hợp thứ ba, toàn bộ tập hợp toán tử cho phép bạn tìm kiếm thông tin trong các trường dịch vụ và siêu dữ liệu. Ví dụ: allinurl sẽ tìm thấy phần được chỉ định trong nội dung của chính các liên kết, allinanchor - trong văn bản có thẻ , allintitle - trong tiêu đề trang, allintext - trong phần nội dung của trang.

    Đối với mỗi toán tử, có một phiên bản lite với tên ngắn hơn (không có tiền tố tất cả). Sự khác biệt là allinurl sẽ tìm các liên kết với tất cả các từ, trong khi inurl sẽ chỉ tìm các liên kết với từ đầu tiên. Các từ thứ hai và các từ tiếp theo từ truy vấn có thể xuất hiện ở bất kỳ đâu trên các trang web. Toán tử inurl cũng khác với một toán tử khác, tương tự về ý nghĩa - trang web. Trước đây cũng cho phép bạn tìm bất kỳ chuỗi ký tự nào trong liên kết đến tài liệu được tìm kiếm (ví dụ: / cgi-bin /), được sử dụng rộng rãi để tìm các thành phần có lỗ hổng đã biết.

    Hãy thử nó trong thực tế. Chúng tôi sử dụng bộ lọc allintext và yêu cầu trả lại danh sách các số thẻ tín dụng và mã xác minh, những mã này sẽ hết hạn chỉ sau hai năm (hoặc khi chủ sở hữu của chúng cảm thấy mệt mỏi với việc cho mọi người ăn liên tiếp).

    Allintext: ngày hết hạn số thẻ / 2017 cvv

    Khi bạn đọc tin tức về một hacker trẻ tuổi "tấn công máy chủ" của Lầu Năm Góc hoặc NASA, đánh cắp thông tin đã được phân loại, thì trong hầu hết các trường hợp, chúng ta đang nói về một kỹ thuật sử dụng Google cơ bản như vậy. Giả sử chúng ta quan tâm đến danh sách các nhân viên NASA và chi tiết liên hệ của họ. Chắc chắn có một danh sách như vậy ở dạng điện tử. Để thuận tiện hoặc thông qua giám sát, nó cũng có thể được tìm thấy trên trang web của tổ chức. Hợp lý là trong trường hợp này sẽ không có liên kết nào đến nó, vì nó được thiết kế để sử dụng nội bộ. Những từ nào có thể có trong một tệp như vậy? Ít nhất - trường "địa chỉ". Kiểm tra tất cả các giả định này rất dễ dàng.


    Inurl: nasa.gov filetype: xlsx "address"


    Chúng tôi sử dụng bộ máy quan liêu

    Những tìm kiếm như thế này là một điều tốt đẹp. Một thông tin thực sự chắc chắn cung cấp kiến ​​thức chi tiết hơn về các toán tử của Google cho quản trị viên web, chính trang Web và cấu trúc của những gì đang được tìm kiếm. Biết được chi tiết, bạn có thể dễ dàng lọc kết quả và tinh chỉnh các thuộc tính của tệp bạn cần để có được dữ liệu thực sự có giá trị ở phần còn lại. Thật buồn cười khi bộ máy hành chính đến giải cứu ở đây. Nó tạo ra các công thức tiêu chuẩn giúp thuận tiện cho việc tìm kiếm thông tin bí mật vô tình bị rò rỉ vào Web.

    Ví dụ, tem tuyên bố Phân phối, là dấu bắt buộc trong văn phòng của Bộ Quốc phòng Hoa Kỳ, có nghĩa là các hạn chế được tiêu chuẩn hóa đối với việc phân phối tài liệu. Chữ A biểu thị các bản phát hành công khai trong đó không có gì bí mật; B - chỉ sử dụng nội bộ, C - tuyệt mật, v.v. cho đến F. Riêng biệt, có chữ X, đánh dấu thông tin đặc biệt có giá trị đại diện cho bí mật nhà nước ở mức cao nhất. Hãy để những tài liệu như vậy được tìm kiếm bởi những người được cho là làm nhiệm vụ và chúng tôi sẽ tự giới hạn mình trong các tệp có ký tự C. Theo chỉ thị DoDI 5230.24, việc đánh dấu như vậy được chỉ định cho các tài liệu chứa mô tả về các công nghệ quan trọng thuộc kiểm soát xuất khẩu. Thông tin được bảo vệ cao như vậy có thể được tìm thấy trên các trang web trong miền cấp cao nhất .mil dành riêng cho Quân đội Hoa Kỳ.

    "BÁO CÁO PHÂN PHỐI C" inurl: navy.mil

    Rất tiện lợi là miền .mil chỉ chứa các trang web của Bộ Quốc phòng Hoa Kỳ và các tổ chức hợp đồng của Bộ Quốc phòng Hoa Kỳ. Các kết quả tìm kiếm bị giới hạn theo miền đặc biệt rõ ràng và các tiêu đề rất dễ hiểu. Thực tế là vô ích khi tìm kiếm bí mật của Nga theo cách này: hỗn loạn ngự trị trong các miền .ru và.rf, và tên của nhiều hệ thống vũ khí nghe có vẻ giống thực vật (PP "Cypress", ACS "Akatsiya") hoặc hoàn toàn tuyệt vời (TOS " Buratino ").


    Bằng cách kiểm tra cẩn thận bất kỳ tài liệu nào từ một trang web trong miền .mil, bạn có thể thấy các điểm đánh dấu khác để tinh chỉnh tìm kiếm của mình. Ví dụ: tham chiếu đến các hạn chế xuất khẩu "Sec 2751", cũng thuận tiện để tìm kiếm thông tin kỹ thuật thú vị. Đôi khi, nó bị rút khỏi các trang web chính thức, nơi nó đã từng xuất hiện, vì vậy nếu bạn không thể nhấp vào một liên kết thú vị trong kết quả tìm kiếm, hãy sử dụng bộ nhớ cache của Google (bộ nhớ cache của nhà điều hành) hoặc trang Lưu trữ Internet.

    Leo lên những đám mây

    Ngoài các tài liệu chính phủ vô tình được giải mật, bộ nhớ cache của Google đôi khi bật lên liên kết đến các tệp cá nhân từ Dropbox và các dịch vụ lưu trữ khác tạo liên kết "riêng tư" đến dữ liệu được phát hành công khai. Nó thậm chí còn tồi tệ hơn với các dịch vụ thay thế và tự chế. Ví dụ: yêu cầu sau tìm dữ liệu từ tất cả khách hàng của Verizon đã cài đặt và sử dụng máy chủ FTP trên bộ định tuyến của họ.

    Allinurl: ftp: // verizon.net

    Hiện có hơn bốn mươi nghìn người thông minh như vậy, và vào mùa xuân năm 2015, số lượng người còn nhiều hơn thế. Thay vì Verizon.net, bạn có thể thay thế tên của bất kỳ nhà cung cấp nổi tiếng nào và nhà cung cấp đó càng nổi tiếng, mức thu nhập có thể càng lớn. Thông qua máy chủ FTP tích hợp, bạn có thể xem các tệp trên bộ nhớ ngoài được kết nối với bộ định tuyến. Thông thường đây là NAS để làm việc từ xa, đám mây cá nhân hoặc một số loại tải xuống tệp ngang hàng. Tất cả nội dung của phương tiện đó được lập chỉ mục bởi Google và các công cụ tìm kiếm khác, vì vậy bạn có thể truy cập các tệp được lưu trữ trên ổ đĩa ngoài bằng liên kết trực tiếp.

    Đang xem cấu hình

    Trước khi di chuyển rộng rãi lên các đám mây, các máy chủ FTP đơn giản, cũng có đủ lỗ hổng bảo mật, được coi là kho lưu trữ từ xa. Nhiều người trong số họ vẫn còn phù hợp cho đến ngày nay. Ví dụ: chương trình WS_FTP Professional phổ biến lưu trữ dữ liệu cấu hình, tài khoản người dùng và mật khẩu trong tệp ws_ftp.ini. Dễ dàng tìm và đọc vì tất cả các bản ghi được lưu trữ dưới dạng văn bản thuần túy và mật khẩu được mã hóa bằng Triple DES sau khi xáo trộn tối thiểu. Trong hầu hết các phiên bản, chỉ cần loại bỏ byte đầu tiên là đủ.

    Có thể dễ dàng giải mã những mật khẩu như vậy bằng tiện ích WS_FTP Password Decryptor hoặc một dịch vụ web miễn phí.

    Khi nói về việc hack một trang web tùy ý, chúng thường có nghĩa là lấy mật khẩu từ nhật ký và bản sao lưu các tệp cấu hình CMS hoặc các ứng dụng thương mại điện tử. Nếu bạn biết cấu trúc điển hình của chúng, bạn có thể dễ dàng chỉ định các từ khóa. Các dòng giống như những dòng được tìm thấy trong ws_ftp.ini là cực kỳ phổ biến. Ví dụ: Drupal và PrestaShop có ID người dùng (UID) và mật khẩu tương ứng (pwd), và tất cả thông tin được lưu trữ trong các tệp có phần mở rộng .inc. Bạn có thể tìm kiếm chúng như sau:

    "pwd =" "UID =" ext: inc

    Tiết lộ mật khẩu từ DBMS

    Trong các tệp cấu hình của máy chủ SQL, tên người dùng và địa chỉ email được lưu trữ dưới dạng văn bản rõ ràng và các băm MD5 của chúng được viết thay vì mật khẩu. Nói đúng ra là không thể giải mã chúng, nhưng bạn có thể tìm thấy sự trùng khớp giữa các cặp mật khẩu băm đã biết.

    Cho đến nay, có những DBMS thậm chí không sử dụng băm mật khẩu. Bạn có thể đơn giản xem các tệp cấu hình cho bất kỳ tệp nào trong số chúng trong trình duyệt.

    Intext: DB_PASSWORD filetype: env

    Với sự ra đời của máy chủ Windows, các tệp cấu hình đã được thay thế một phần bởi sổ đăng ký. Bạn có thể tìm kiếm thông qua các nhánh của nó theo cùng một cách, sử dụng reg làm loại tệp. Ví dụ, như thế này:

    Loại tệp: reg HKEY_CURRENT_USER "Mật khẩu" =

    Đừng quên điều hiển nhiên

    Đôi khi, có thể truy cập thông tin đã phân loại với sự trợ giúp của dữ liệu vô tình được mở ra và lọt vào tầm ngắm của Google. Tốt nhất, hãy tìm một danh sách mật khẩu ở một số định dạng phổ biến. Chỉ những người tuyệt vọng mới có thể lưu trữ thông tin tài khoản trong tệp văn bản, tài liệu Word hoặc bảng tính Excel, nhưng luôn có đủ chúng.

    Filetype: xls inurl: password

    Một mặt, có nhiều cách để ngăn chặn những sự cố như vậy. Cần quy định đầy đủ quyền truy cập trong htaccess, vá CMS, không sử dụng các script bên trái và đóng các lỗ hổng khác. Ngoài ra còn có tệp robots.txt ngăn các công cụ tìm kiếm lập chỉ mục các tệp và thư mục được chỉ định trong đó. Mặt khác, nếu cấu trúc robots.txt trên một số máy chủ khác với cấu trúc tiêu chuẩn, thì bạn có thể thấy ngay những gì họ đang cố gắng che giấu trên đó.

    Danh sách các thư mục và tệp trên bất kỳ trang web nào được đặt trước bởi chỉ mục tiêu chuẩn của. Vì đối với mục đích dịch vụ, nó phải xuất hiện trong tiêu đề, nên giới hạn tìm kiếm của nó đối với toán tử intitle. Những điều thú vị được tìm thấy trong thư mục / admin /, / personal /, / etc / và thậm chí / secret /.

    Theo dõi các bản cập nhật

    Sự liên quan ở đây là cực kỳ quan trọng: các lỗ hổng cũ được đóng lại rất chậm, nhưng Google và kết quả tìm kiếm của nó liên tục thay đổi. Thậm chí có sự khác biệt giữa bộ lọc “giây cuối cùng” (& tbs = qdr: s ở cuối url yêu cầu) và “thời gian thực” (& tbs = qdr: 1).

    Khoảng thời gian của ngày cập nhật tệp cuối cùng từ Google cũng được chỉ rõ. Thông qua giao diện web đồ họa, bạn có thể chọn một trong các khoảng thời gian điển hình (giờ, ngày, tuần, v.v.) hoặc đặt phạm vi ngày, nhưng phương pháp này không phù hợp với tự động hóa.

    Từ giao diện của thanh địa chỉ, bạn chỉ có thể đoán về cách giới hạn đầu ra của kết quả bằng cách sử dụng cấu trúc & tbs = qdr :. Chữ cái y sau nó đặt giới hạn một năm (& tbs = qdr: y), m hiển thị kết quả của tháng trước, w trong tuần, d cho ngày qua, h cho giờ trước, n cho phút , và cho tôi một chút. Các kết quả gần đây nhất vừa được báo cáo cho Google được tìm thấy bằng cách sử dụng bộ lọc & tbs = qdr: 1.

    Nếu bạn cần viết một tập lệnh phức tạp, sẽ rất hữu ích khi biết rằng phạm vi ngày được đặt trong Google ở ​​định dạng Julian bằng cách sử dụng toán tử daterange. Ví dụ: đây là cách bạn có thể tìm thấy danh sách các tệp PDF có từ bí mật được tải lên từ ngày 1 tháng 1 đến ngày 1 tháng 7 năm 2015.

    Loại tệp bí mật: pdf daterange: 2457024-2457205

    Phạm vi được chỉ định ở định dạng ngày Julian, không bao gồm phần phân số. Việc dịch chúng theo cách thủ công từ lịch Gregory là điều bất tiện. Sử dụng công cụ chuyển đổi ngày tháng sẽ dễ dàng hơn.

    Nhắm mục tiêu và lọc lại

    Ngoài việc chỉ định các toán tử bổ sung trong truy vấn tìm kiếm, bạn có thể gửi chúng trực tiếp trong phần nội dung của liên kết. Ví dụ: loại tệp đủ điều kiện: pdf tương ứng với cấu trúc as_filetype = pdf. Vì vậy, rất thuận tiện để chỉ định bất kỳ làm rõ nào. Giả sử rằng chỉ trả về kết quả từ Cộng hòa Honduras được chỉ định bằng cách thêm cấu trúc cr = countryHN vào URL tìm kiếm và chỉ từ thành phố Bobruisk - gcs = Bobruisk. Xem phần nhà phát triển để có danh sách đầy đủ.

    Các công cụ tự động hóa của Google nhằm giúp cuộc sống dễ dàng hơn, nhưng chúng thường thêm vào những thách thức. Ví dụ: thành phố của người dùng được xác định bởi IP của người dùng thông qua WHOIS. Dựa trên thông tin này, Google không chỉ cân bằng tải giữa các máy chủ mà còn thay đổi kết quả tìm kiếm. Tùy thuộc vào khu vực, đối với cùng một yêu cầu, trang đầu tiên sẽ nhận được các kết quả khác nhau và một số trong số đó có thể bị ẩn hoàn toàn. Để cảm thấy như một người dân quốc tế và tìm kiếm thông tin từ bất kỳ quốc gia nào, mã gồm hai chữ cái sau chỉ thị gl = country sẽ hữu ích. Ví dụ, mã của Hà Lan là NL, nhưng Vatican và Triều Tiên không có mã riêng của họ trên Google.

    Thông thường, kết quả tìm kiếm lộn xộn ngay cả sau khi sử dụng một vài bộ lọc nâng cao. Trong trường hợp này, có thể dễ dàng tinh chỉnh truy vấn bằng cách thêm một số từ loại trừ vào nó (mỗi từ được đặt trước bởi một dấu trừ). Ví dụ, ngân hàng, tên và hướng dẫn thường được sử dụng với từ Cá nhân. Do đó, kết quả tìm kiếm rõ ràng hơn sẽ không được hiển thị bằng một ví dụ sách giáo khoa về truy vấn, mà bằng một kết quả tinh chỉnh:

    Intitle: "Index of / Personal /" -names -tutorial -banking

    Ví dụ cuối cùng

    Hacker tinh vi được phân biệt bởi thực tế là anh ta tự cung cấp cho mình mọi thứ anh ta cần. Ví dụ, một VPN rất tiện lợi, nhưng đắt tiền hoặc tạm thời và hạn chế. Quá đắt để đăng ký cho một mình bạn. Thật tốt khi có đăng ký nhóm và với sự trợ giúp của Google, bạn có thể dễ dàng trở thành một phần của nhóm. Để thực hiện việc này, chỉ cần tìm tệp cấu hình VPN của Cisco, tệp này có phần mở rộng PCF khá không chuẩn và đường dẫn dễ nhận biết: Tệp Chương trình \ Cisco Systems \ VPN Client \ Profiles. Một yêu cầu, và bạn tham gia, ví dụ, các nhân viên thân thiện của Đại học Bonn.

    Loại tệp: pcf vpn HOẶC Nhóm

    THÔNG TIN

    Google tìm thấy các tệp cấu hình có mật khẩu, nhưng nhiều tệp trong số đó được mã hóa hoặc thay thế bằng mã băm. Nếu bạn thấy các chuỗi có độ dài cố định thì hãy tìm ngay dịch vụ giải mã.

    Mật khẩu được lưu trữ bằng mã hóa, nhưng Maurice Massard đã viết một chương trình để giải mã chúng và cung cấp miễn phí thông qua thecampusgeeks.com.

    Hàng trăm kiểu tấn công và kiểm tra thâm nhập khác nhau được thực hiện bằng Google. Có nhiều tùy chọn, ảnh hưởng đến các chương trình phổ biến, định dạng cơ sở dữ liệu chính, nhiều lỗ hổng PHP, đám mây, v.v. Nếu bạn có một ý tưởng chính xác về những gì bạn đang tìm kiếm, việc thu thập thông tin cần thiết sẽ đơn giản hóa rất nhiều (đặc biệt là thông tin không được lên kế hoạch công khai). Shodan không phải là một nguồn ý tưởng thú vị, mà là mọi cơ sở dữ liệu của các tài nguyên mạng được lập chỉ mục!