Re: Full-Text Search

From: Kevin Adistambha <kevinadi@xxxxxxxxxxx>
To: mongodb-user <mongodb-user@xxxxxxxxxxxxxxxx>
Date: Sun, 17 Apr 2016 21:22:41 -0700 (PDT)
Why ads?


Hi Sameer,

Are documents (Microsft Word, pdf) stored in MongoDB full-text searchable?

Are you storing MS Word or PDF files in MongoDB? The short answer is no. 
Binary files (e.g. MS Word or PDF files) stored in MongoDB are not 
full-text searchable.

The term “document” in MongoDB refers to BSON document 
<https://docs.mongodb.org/manual/core/document/>, which is a binary 
representation of a JSON document 
<https://docs.mongodb.org/manual/reference/glossary/#term-json>. Please 
note that a BSON document stored in MongoDB currently has a size limit of 16 
MB <https://docs.mongodb.org/manual/reference/limits/#bson-documents>.

The full-text search feature of MongoDB refers to searching and indexing 
one or more text fields <https://docs.mongodb.org/manual/core/index-text/
in a BSON document.

If your use case requires you to store binary files such as MS Word or PDF 
in MongoDB, the currently supported method is using GridFS 
<https://docs.mongodb.org/manual/core/gridfs/>, which is designed for 
storing files that are larger than 16 MB in MongoDB. You can store 
searchable metadata for GridFS files (but would have to use a third party 
library to extract this from binary documents like Word or PDF files). An 
example use case is described in detail in Metadata and Asset Management. 
<https://docs.mongodb.org/ecosystem/use-cases/metadata-and-asset-management/>

Best regards,
Kevin


-- 
You received this message because you are subscribed to the Google Groups "mongodb-user"
group.

For other MongoDB technical support options, see: https://docs.mongodb.org/manual/support/
--- 
You received this message because you are subscribed to the Google Groups "mongodb-user" group.
To unsubscribe from this group and stop receiving emails from it, send an email to mongodb-user+unsubscribe@xxxxxxxxxxxxxxxx.
To post to this group, send email to mongodb-user@xxxxxxxxxxxxxxxx.
Visit this group at https://groups.google.com/group/mongodb-user.
To view this discussion on the web visit https://groups.google.com/d/msgid/mongodb-user/9889e535-303a-4a17-b50a-3d12b3fecb6a%40googlegroups.com.
For more options, visit https://groups.google.com/d/optout.
Why ads?