:::

詳目顯示

回上一頁
題名:國小高年級數學科應用問題題庫之建立及其題目參數估計和量尺化相關問題之探討
書刊名:初等教育學報
作者:洪碧霞 引用關係
出版日期:1992
卷期:5
頁次:頁91-122
主題關鍵詞:參數估計高年級國小量尺化數學科應用問題題目題庫
原始連結:連回原系統網址new window
相關次數:
  • 被引用次數被引用次數:期刊(1) 博士論文(0) 專書(0) 專書論文(0)
  • 排除自我引用排除自我引用:1
  • 共同引用共同引用:10
  • 點閱點閱:33
本研究採MULTILOG(Thissen,1986,PC版)中Graded之模式及ASCAL和BILOG之雙參數模式,分析國小六年級數學科應用題,其題型為題群組合,大題內子題共享題幹。分別以各軟體中之相關模式計算出大題和子題參數值以資比較,探討數學科題庫中應用問題參數估計及量尺化所必需面對的特殊考慮或困難,使題型的選擇不限於對錯二分的選擇題,以期能用最適切並省時省力的方式來編製有效的測驗。本研究主要發現摘要如次: 一、由因素分析和數估計的卡方值得知,對本研究所採用的題群組型,採取二元計分並不嚴重違反單一向度的假設,即二元參數估計軟體也可估計共享題幹的題目,只要子題間法有連續的相依性。 二、由於本研究題目偏難,以多元計分之軟體MULTILOG來分析,經常面臨題目太難造成部分參數估計值相當極端且標準誤過大的問題。也因此樣本能力無法估計,所以無法做連結。受實際資料的限制,其原因很難做清晰、深入的討論,因此也無法與使用ASCAL、BILOG軟體所估計之連結效益做比較,有關Graded模式題目參數連結的問題,有待更進一步的探討。 一、 使用ASCAL、BILOG軟體所估計的參數之連結效益部分,單就共同試題的評估,平均數標準差法和特徵曲線法在難度上都優於連結前;在鑑別度上,則不一定優於連結前。本研究的題目屬雙參數模式,就平均數標準差法和特徵曲線法而言,仍有利於難度的連結。當然這項結論僅屬個案之初探,有關數學科應用問題之連結,亟待更多模擬研究的投入。 二、 就三個不同的軟體之適用情況比較,對子題二元計分的題群組而言,ASCAL及BILOG估得的參數所反映出來的測驗特質大致雷同,其連結結果之效益也非常相近,MULTILOG使用時限制較大,其所面臨未知的問題也較多,因此就本研究之資料而言,可能以予題獨立之二元計分模式較為適切簡易。 本研究就甲、乙兩式測驗應試之高雄和臺南兩樣本考生之能力而言,其差異並不明顯,連結效益無從發揮,在這種情況下,尤其是在題庫建立之起始點,同時估計法可能可以考慮採用。
期刊論文
1.Samejima, F.(1969)。Estimation of latent ability using a response pattern of graded scores。Psychometrika Monograph Supplement,4(2),1-100。  new window
2.Thissen, D.、Steinberg, L.(1984)。A response model for multiple choice items。Psychometrika,49,501-519。  new window
3.Reckase, M. D.(1979)。Unifactor latent trait models applied to multifactor tests: Results and implications。Journal of Educational Statistics,4(3),207-230。  new window
4.Koch, W. R.(1983)。Likert scaling using the graded response latent trait model。Applied Psychological Measurement,7(1),15-32。  new window
5.洪碧霞、吳鐵雄(19890100)。簡介電腦化適性測驗的發展及其實施要素並兼論我國大專聯考電腦適性化的可行性。測驗年刊,36,75-94。new window  延伸查詢new window
6.吳裕益(19900900)。選擇題選對評分法與刪錯評分法題目鑑別度、信度及效度之比較研究。初等教育學報,3,33-78。new window  延伸查詢new window
7.Samejima, F.(1977)。A use of information Function in tailored testing。Applied Psychological Measurement,1(2),233-245。  new window
8.Masters, G. N.(1982)。A Rasch model for partial credit scoring。Psychometrika,47(2),149-174。  new window
9.Bock, R. D.(1972)。Estimating item parameters and latent ability when responses are scored in two or more nominal categories。Psychometrika,37(1),29-51。  new window
會議論文
1.Koch, W. R.(1981)。Parameter in variance of the graded response latent trait model。The Annual Meeting of the National Council on Measurement in Education。Los Angeles。  new window
2.Samejima, F.(1976)。The graded response model of latent trait theory and tailored testing。The First Conference on Computerized Adaptive Testing。Washington, DC:Government Printing Office。  new window
3.Samejima, F.(1977)。The Application of graded response models: The promise of the future。The 1977 Item Response Theory and Computerized Adaptive Testing Conference。Minneapolis:University of Minnesota, Department of Psychology, Computerized Adaptive Testing Laboratory。  new window
圖書
1.Murnane, R. J.、Raizen, S. A.(1988)。Improving indicators of the quality of science and mathematics education in grades K-12。Washington, DC:National Academy Press。  new window
2.Mislevy, R. J.、Bock, R. D.(1986)。PC-Bilog: Item Analysis and Test Scoring with Binary Logistic Models。Mooresville, IN:Scientific Software, Inc.。  new window
3.洪碧霞、吳裕益、陳英豪、黃淑津、蕭淳元(1991)。題目IRT參數量尺化系列研究(EMC-TR-91-6)。台南師範學院測驗發展中心。  延伸查詢new window
4.Assessment System。MicroCAT使用手冊。  延伸查詢new window
5.Kolakowski, D.、Bock, R. D.(1973)。Maximum likelihood item analysis and test scoring: Logistic model for multiple item responses。Ann Arbor, MI:National Educational Resources。  new window
6.Alexander, L.、James, H. T.(1987)。The nation's report card。Cambridge, MA:National Academy of Education。  new window
7.Thissen, D.(1988)。MULTILOG: Multiple, Categorical Item Analysis and Test Scoring Using Item Response Theory。Scientific Software。  new window
8.National Council of Teachers of Mathematics(1989)。Curriculum and evaluation standards for school mathematics。Reston, VA:National Council of Teachers of Mathematics。  new window
單篇論文
1.Reise, S. P.(1989)。Structure and precision in the measurement of positive and negative affect。  new window
其他
1.Dodd, B. G.(1984)。Attitude scaling: A comparison of the graded response and partial credit latent trait models。  new window
圖書論文
1.吳裕益(1991)。題目分析軟體介紹。題庫專輯。  延伸查詢new window
2.Collis, K.、Romberg, T. A.(1991)。Assessement of mathematical performance: An analysis of open-ended test items。Testing and cognition。Prentice-Hall, Inc。  new window
3.Birnbaum, A. L.(1968)。Some latent trait models and their use in inferring an examinee's ability。Statistical theories of mental test scores。Addison-Wesley Publishing Company。  new window
 
 
 
 
第一頁 上一頁 下一頁 最後一頁 top
QR Code
QRCODE