Национальный корпус русского языка — доступный для поиска электронный online корпус русских текстов.
На сайте ruscorpora.ru помещен представительный размеченный корпус современного русского языка. Корпус предназначен для всех, кто интересуется самыми разными вопросами, связанными с русским языком: профессиональных лингвистов, преподавателей языка, школьников и студентов, иностранцев, изучающих русский язык.
Национальный корпус создается лингвистами (специалистами по так называемой корпусной лингвистике, быстро развивающейся современной области языкознания) для научных исследований и обучения языку.
В Национальный корпус русского языка будут включены прежде всего тексты, представляющие современный русский литературный язык (с начала XIX в.) и тексты, представляющие древнерусский язык (XI-XIV вв.) и нелитературные формы современного русского языка: разговорную, просторечную, диалектную.
Национальный корпус русского языка в октябре 2004 г. содержал 13 246 текстов общим объемом 35 238 929 словоупотреблений, а в октябре 2013 года – 85 996 документов, 19 362 746 предложений, 229 968 798 слов.
Рекомендую посмотрететь запись мастер-класса Александра Матюшкина