เว็บไซต์ Thai Learner English Corpus เป็นแหล่งรวบรวมคลังข้อมูลบทความภาษาอังกฤษที่เขียนโดยผู้เรียนชาวไทยระดับมหาวิทยาลัย โดยมีวัตถุประสงค์เพื่อใช้ในการศึกษาวิเคราะห์ลักษณะการใช้ภาษาอังกฤษของผู้เรียนชาวไทย ทั้งในแง่ของพัฒนาการทางภาษาของผู้เรียน ความผิดพลาดทางภาษา (error analysis) และรูปแบบการใช้ภาษาในระดับต่างๆ เพื่อเป็นฐานข้อมูลสำหรับงานวิจัยด้านภาษาศาสตร์ประยุกต์ การสอนภาษาอังกฤษ และการพัฒนาสื่อการเรียนการสอน

คลังข้อมูลนี้แบ่งออกเป็นสามกลุ่มใหญ่ ได้แก่

  1. ผู้เรียนระดับกลาง (Intermediate Learners) ซึ่งส่วนใหญ่เป็นนิสิตนักศึกษาชั้นปีที่ 1 จากหลายคณะของจุฬาลงกรณ์มหาวิทยาลัยและมหาวิทยาลัยธรรมศาสตร์ โดยคลังข้อมูลนี้ประกอบด้วยบทความจำนวน 1,538 เรื่องจากนิสิตธรรมศาสตร์ (ประมาณ 542,000 คำ) และ 1,281 เรื่องจากนิสิตคณะอักษรศาสตร์ จุฬาฯ (ประมาณ 338,000 คำ) รวมทั้งสิ้นประมาณ 880,000 คำ
  2. ผู้เรียนระดับสูง (Advanced Learners) ซึ่งเป็นนิสิตชั้นปีที่ 2 คณะอักษรศาสตร์ จุฬาฯ ที่เรียนเอกภาษาอังกฤษ โดยคลังข้อมูลนี้มีขนาดประมาณ 66,000 คำ จากบทความ 54 เรื่อง สะท้อนความสามารถทางภาษาในระดับที่มีความชำนาญมากขึ้น และเหมาะสำหรับการวิเคราะห์ลักษณะภาษาที่ซับซ้อนขึ้น หรือการเปรียบเทียบกับระดับกลาง
  3. กลุ่มนักเขียนมืออาชีพ (Professional TLE) ประกอบด้วยบทความภาษาอังกฤษที่เขียนโดยนักข่าวชาวไทยในหนังสือพิมพ์ภาษาอังกฤษสองฉบับ คือ The Nation และ Bangkok Post รวม 2,739 บทความ คิดเป็นจำนวนคำประมาณ 294,000 คำ กลุ่มข้อมูลนี้มีความสำคัญสำหรับใช้เปรียบเทียบกับกลุ่มผู้เรียน เพื่อดูความแตกต่างด้านความแม่นยำทางภาษา การเลือกคำ และการจัดวางโครงสร้างทางภาษา