小学堂文字学数据库于2013年4月25日开始运作,是承袭中央研究院2005年至2013年的汉字构形数据库,提供中文研究所需、查询文字学演变与释义的跨数据库整合查询工具。此数据库由行政院国家科学委员会经费补助,中央研究院历史语言研究所、资讯科学研究所、以及台湾大学中国文学系所共同开发。
小学堂收录内容主要分为“字形”(汉字古今字数据库)与“字音”(汉字古今音数据库)两类内容——字形查询可以查阅到甲骨文、金文、战国时期楚系简帛文字(后续另新增了秦系简帛文字)、小篆、楷书(异体字表)的资料内容,总计有超过十八万笔。;字音查询则包含了上古音、中古音、官话、晋语、吴语、徽语、赣语、湘语、闽语、粤语、平话、客语、以及其他土话数据库,总计有超过一百万笔。除字形与字音外,小学堂网站还有收录超过二十五万笔、共计27本纸本文字学出版物的索引资料,以及一些在文字学的资讯工具,如吴守礼台语注音字体与输入法等。(注:上述收录内容的描述仍不断在变动,收录资料仍有增减。请至小学堂网站的收录现况查阅最新的收录范围。)
小学堂文字学数据库的出现,大幅度的简化、加速了原本中文文字研究的检索效率。同时也有使用者指出小学堂跟民间文字学数据库——例如汉字叔叔或汉典——相比,收录与分类的方式更为严谨与完整。但也有使用者认为字体的数字化仍有问题,对照早期出土文字资料时数位临摹的档案有描绘不够精准的问题。