Trung bình cộng

Thương của tổng họ các con số với số các con số trong họ đóBản mẫu:SHORTDESC:Thương của tổng họ các con số với số các con số trong họ đó

Trong toán họcthống kê, trung bình cộng (và rất ít khi là trung bình số học), hay được gọi ngắn đi là trung bình (khi đã rõ ngữ cảnh), là thương số giữa tổng của một họ các số với số lượng các con số trong họ đó.[1] Họ các con số ở đây thường là tập kết quả từ một cuộc thí nghiệm, nghiên cứu quan sát hoặc phỏng vấn. Tên gọi "trung bình số học" đôi khi được dùng để đối chiếu với bản tiếng Anh (arithmetic mean), tương tự đối với trung bình hình học.

Bên ngoài toán học và thống kê, trung bình cộng cũng được dùng nhiều trong kinh tế học, nhân loại họclịch sử và gần như có sử dụng trong mọi nhánh học. Ví dụ chẳng hạn, thu nhập bình quân đầu người là trung bình cộng của thu nhập của toàn bộ dân số của một quốc gia.

Mặc dù trung bình cộng thường được dùng để báo cáo xu hướng tập trung, nó không phải là thống kê chuẩn mạnh: nó bị ảnh hưởng rất nhiều từ các giá trị bất thường (các giá trị hoặc cực lớn hoặc cực nhỏ so với số còn lại). Đối với các phân phối bị xiên, ví dụ như trong phân phối thu nhập, trong đó sẽ có một số người có thu nhập hơn rất nhiều so với đa số những người còn lại, trung bình cộng sẽ khó xác định "giá trị đứng giữa" của phân phối đó. Trong trường hợp này, dùng trung vị có thể mô tả tốt hơn xu hướng tập trung.

Định nghĩa

Cho tập dữ liệu X = { x 1 , , x n } {\displaystyle X=\{x_{1},\ldots ,x_{n}\}} , trung bình cộng (hoặc được gọi ngắn đi là trung bình), và được ký hiệu là x ¯ {\displaystyle {\bar {x}}} (đọc là x {\displaystyle x} gạch trên), là trung bình cộng của n {\displaystyle n} giá trị x 1 , , x n {\displaystyle x_{1},\ldots ,x_{n}} .[2]

Trong tập dữ liệu, trung bình cộng là trong những cách thường dùng để hiểu độ đo của xu hướng tập trung. Trung bình cộng của tập dữ liệu quan sát bằng với tổng các giá trị số của mỗi quan sát chia cho số lần quan sát. Viết dưới công thức cho tập dữ liệu bao gồm các giá trị, trung bình cộng được định nghĩa như sau:

x ¯ = 1 n ( i = 1 n x i ) = x 1 + x 2 + + x n n {\displaystyle {\bar {x}}={\frac {1}{n}}\left(\sum _{i=1}^{n}{x_{i}}\right)={\frac {x_{1}+x_{2}+\dots +x_{n}}{n}}} [3]

(Dấu Σ {\displaystyle \Sigma } ký hiệu cho phép lấy tổng.)

Ví dụ chẳng hạn, nếu lương hàng tháng của 10 {\displaystyle 10} nhân viên là như sau: { 2500 , 2700 , 2400 , 2300 , 2550 , 2650 , 2750 , 2450 , 2600 , 2400 } {\displaystyle \{2500,2700,2400,2300,2550,2650,2750,2450,2600,2400\}} , thì trung bình cộng của lương của bọn họ là:

2500 + 2700 + 2400 + 2300 + 2550 + 2650 + 2750 + 2450 + 2600 + 2400 10 = 2530 {\displaystyle {\frac {2500+2700+2400+2300+2550+2650+2750+2450+2600+2400}{10}}=2530}

Nếu tập dữ liệu là quần thể thống kê (tức là chứa mọi quan sát khả thi và không chỉ là tập con của chúng) thì trung bình cộng đó được gọi là trung bình quần thể và được ký hiệu bởi chữ Hy Lạp μ {\displaystyle \mu } . Nếu tập dữ liệu là mẫu thống kê (là tập con của quần thể), thì trung bình cộng được gọi là trung bình mẫu (trung bình đối với tập dữ liệu X {\displaystyle X} được viết là X ¯ {\displaystyle {\overline {X}}} ).

Trung bình cộng được định nghĩa tương tự cho vectơ trong nhiều chiều, chứ không nhất thiết phải giữa các giá trị scalar. Tổng quát hơn, bởi vì trung bình cộng là tổ hợp lồi (tức là tổng các hệ số của nó bằng 1 {\displaystyle 1} ), nó có thể được định nghĩa trên không gian lồi chứ không chỉ không gian vectơ.

Các tính chất thúc đẩy

Trung bình cộng có một số tính chất đặc biệt, nhất là khi dùng để đo xu hướng tập trung. Chúng bao gồm:

  • Nếu x 1 , , x n {\displaystyle x_{1},\dotsc ,x_{n}} có giá trị trung bình x ¯ {\displaystyle {\bar {x}}} , thì ( x 1 x ¯ ) + + ( x n x ¯ ) = 0 {\displaystyle (x_{1}-{\bar {x}})+\dotsb +(x_{n}-{\bar {x}})=0} . Bởi x i x ¯ {\displaystyle x_{i}-{\bar {x}}} là khoảng cách từ số đó đến trung bình, ta có thể xem tính chất là đang nói rằng các phần tử ở bên trái đang được cân bằng bởi các phần tử ở bên phải. Giá tri trung bình là giá trị duy nhất sao cho các phần dư (độ lệch so với ước lượng) có tổng bằng không. Ta cũng có thể xem giá trị trung bình có tính bất biến tịnh tiến bởi cho bất kỳ số thực a {\displaystyle a} , x + a ¯ = x ¯ + a {\displaystyle {\overline {x+a}}={\bar {x}}+a} .
  • Nếu buộc phải dùng một giá trị "tầm thường" cho một tập các số đã biết x 1 , , x n {\displaystyle x_{1},\dotsc ,x_{n}} , thì trung bình cộng thường là tốt nhất bởi nó đã tối thiểu hoá tổng của các bình phương độ lệch chuẩn từ giá trị thường: tức tổng của ( x i x ¯ ) 2 {\displaystyle (x_{i}-{\bar {x}})^{2}} . Trung bình mẫu cũng là ước lượng đơn tốt nhất bởi nó có sai số dùng căn trung bình bình phương nhỏ nhất.[2] Nếu cần phải dùng trung bình cộng cho cả một quần thể , thì ước lượng không chệch của nó là trung bình cộng của một mẫu lấy từ quần thể.
  • Trung bình cộng không phụ thuộc đơn vị đo, bởi avg ( c a 1 , , c a n ) = c avg ( a 1 , , a n ) . {\displaystyle {\text{avg}}(ca_{1},\cdots ,ca_{n})=c\cdot {\text{avg}}(a_{1},\cdots ,a_{n}).} Ví dụ chẳng hạn, tính trung bình theo đơn vị lít rồi đổi sang ga-lông thì cũng tương tự với đổi sang đơn vị ga-lông rồi mới tính trung bình. Tính chất này được gọi là tính thuần nhất bậc nhất.

Trái với trung vị

Trung bình cộng có thể trái với trung vị. Giá trị trung vị được định nghĩa sao cho không có hơn một nửa trong tập lớn hơn nó và cũng không có hơn một nửa trong tập nhỏ hơn nó. Khi sắp xếp các dữ liệu theo một thứ tự nào đó sao cho các dữ liệu tăng theo cấp số cộng, thì trong trường hợp này trung bình và trung vị là cùng một giá trị. Ví dụ chẳng hạn, xét tập { 1 , 2 , 3 , 4 } {\displaystyle \{1,2,3,4\}} . Giá trị trung bình là 2.5 {\displaystyle 2.5} , và giá trị trung vị cũng bằng 2.5. Tuy nhiên, nếu như tập hợp không thể sắp xếp được sao cho dữ liệu tăng theo cấp số cộng, chẳng hạn như tập { 1 , 2 , 4 , 8 , 16 } {\displaystyle \{1,2,4,8,16\}} , thì giá trị trung bình sẽ sai khác đáng kể so với giá trị trung vị. Trong ví dụ này, trung bình bằng với 6.2 {\displaystyle 6.2} , còn trung vị là 4 {\displaystyle 4} . Giá trị trung bình có thể lớn hơn hoặc nhỏ hơn so với đa số dữ liệu trong tập.

Có nhiều ứng dụng cho hiện tượng này trong nhiều ngành. Ví dụ chẳng hạn, kể từ năm 1980, trung vị thu nhập của Hoa Kỳ chậm hơn nhiều so với trung bình thu nhập.[4]

Tổng quát

Trung bình có trọng số

Trung bình có trọng số là trung bình trong đó có một số điểm dữ liệu có "trọng lượng" nhiều hơn một số khác khi tính toán.[5] Ví dụ chẳng hạn, trung bình của 3 {\displaystyle 3} 5 {\displaystyle 5} 3 + 5 2 = 4 {\displaystyle {\frac {3+5}{2}}=4} , hoặc tương đương 3 1 2 + 5 1 2 = 4 {\displaystyle 3{\frac {1}{2}}+5{\frac {1}{2}}=4} . Ngược lại, trong trung bình có trọng số, ta có thể đổi sao cho số đầu tiên có trọng số gấp đôi số thứ hai (có thể là vì số đó có tần suất xuất hiện gấp đôi số còn lại). Khi đó trung bình sẽ được như sau: 3 2 3 + 5 1 3 = 11 3 {\displaystyle 3{\frac {2}{3}}+5{\frac {1}{3}}={\frac {11}{3}}} . Ở đây, các trọng số phải có tổng bằng một, là 2 3 {\displaystyle {\frac {2}{3}}} 1 3 {\displaystyle {\frac {1}{3}}} , trong đó cái đầu gấp đôi cái thứ hai. Do đó, trung bình cộng có thể được coi là trường hợp đặc biệt của trung bình có trọng số trong đó các trọng số đều bằng nhau ( 1 2 {\displaystyle {\frac {1}{2}}} trong trường hợp trên và 1 n {\displaystyle {\frac {1}{n}}} trong trường hợp tổng quát xét n {\displaystyle n} số).

Góc

Dấu và mã hoá

Trung bình cộng thường được ký hiệu bằng dấu gạch trên đầu, như trong x ¯ {\displaystyle {\bar {x}}} .[2]

Một số phần mềm (chẳng hạn như các phần mềm xử lý văn bản, trình duyệt web) có thể không hiển thị đúng ký hiệu "x̄". Ví dụ chẳng hạn, dấu HTML "x̄" gộp hai mã — ký tự gốc "x" thêm một mã cho dấu gạch trên (̄ hoặc ¯).[6]

Xem thêm

Tham khảo

  1. ^ Jacobs, Harold R. (1994). Mathematics: A Human Endeavor . W. H. Freeman. tr. 547. ISBN 0-7167-2426-X.
  2. ^ a b c Medhi, Jyotiprasad (1992). Statistical Methods: An Introductory Text. New Age International. tr. 53–58. ISBN 9788122404197.
  3. ^ Weisstein, Eric W. “Arithmetic Mean”. mathworld.wolfram.com (bằng tiếng Anh). Truy cập 21 Tháng tám năm 2020.
  4. ^ Krugman, Paul (4 tháng 6 năm 2014) [Fall 1992]. “The Rich, the Right, and the Facts: Deconstructing the Income Distribution Debate”. The American Prospect.
  5. ^ “Mean | mathematics”. Encyclopedia Britannica (bằng tiếng Anh). Truy cập 21 Tháng tám năm 2020.
  6. ^ “Notes on Unicode for Stat Symbols”. www.personal.psu.edu. Bản gốc lưu trữ 31 Tháng Ba năm 2022. Truy cập 14 tháng Mười năm 2018.

Đọc thêm

  • Huff, Darrell (1993). How to Lie with Statistics. W. W. Norton. ISBN 978-0-393-31072-6.

Liên kết ngoài

  • Calculations and comparisons between arithmetic mean and geometric mean of two numbers
  • Calculate the arithmetic mean of a series of numbers on fxSolver
  • x
  • t
  • s
  • Outline of statistics
  • List of statistics articles
Continuous probability distribution
Central tendency
Statistical dispersion
Shape of a probability distribution
Count data
  • Index of dispersion
Summary tables
  • Grouped data
  • Frequency distribution
  • Contingency table
Hệ số tương quan
  • Pearson correlation coefficient
  • Rank correlation
    • Spearman's rank correlation coefficient
    • Kendall rank correlation coefficient
  • Partial correlation
  • Scatter plot
Statistical graphics
  • Bar chart
  • Biplot
  • Box plot
  • Control chart
  • Correlogram
  • Fan chart (statistics)
  • Forest plot
  • Histogram
  • Pie chart
  • Q–Q plot
  • Run chart
  • Scatter plot
  • Stem-and-leaf display
  • Radar chart
  • Violin plot
Design of experiments
Survey methodology
  • Sampling (statistics)
    • Stratified sampling
    • Cluster sampling
  • Standard error
  • Opinion poll
  • Questionnaire
Thí nghiệm
  • Scientific control
  • Randomized experiment
  • Randomized controlled trial
  • Random assignment
  • Blocking (statistics)
  • Interaction (statistics)
  • Factorial experiment
Adaptive Designs
  • Adaptive clinical trial
  • Up-and-Down Designs
  • Stochastic approximation
Observational study
  • Cross-sectional study
  • Cohort study
  • Natural experiment
  • Quasi-experiment
Statistical theory
  • Quần thể thống kê
  • Hoạt động thống kê
  • Phân phối xác suất
  • Sampling distribution
    • Order statistic
  • Empirical distribution function
    • Density estimation
  • Mô hình thống kê
    • Statistical model specification
    • Lp space
  • Statistical parameter
    • Location parameter
    • Scale parameter
    • Shape parameter
  • Parametric statistics
    • Likelihood function Monotone likelihood ratio
    • Location–scale family
    • Exponential family
  • Completeness (statistics)
  • Thống kê đủ
  • Plug-in principle
    • Bootstrapping (statistics)
    • U-statistic
    • V-statistic
  • Optimal decision
  • Efficiency (statistics)
  • Statistical distance
    • Divergence (statistics)
  • Asymptotic theory (statistics)
  • Robust statistics
Frequentist inference
Point estimation
  • Estimating equations
  • Bias of an estimators
    • Minimum-variance unbiased estimator
      • Rao–Blackwell theorem
      • Lehmann–Scheffé theorem
    • Median-unbiased estimator
  • Plug-in principle
Interval estimation
  • Khoảng tin cậy
  • Pivotal quantity
  • Likelihood interval
  • Prediction interval
  • Tolerance interval
  • Resampling (statistics)
    • Bootstrapping (statistics)
    • Jackknife resampling
Kiểm định giả thuyết thống kê
  • One- and two-tailed tests
  • Power of a test
    • Uniformly most powerful test
  • Permutation test
    • Resampling (statistics)
  • Multiple comparisons problem
Parametric statistics
  • Likelihood-ratio test
  • Score test
  • Wald test
Specific tests
  • Z-test
  • Student's t-test
  • F-test
Goodness of fit
Rank statistics
  • Sign test
    • Sample median
  • Wilcoxon signed-rank test
    • Hodges–Lehmann estimator
  • Mann–Whitney U test
  • Nonparametric statistics Analysis of variance
    • Kruskal–Wallis one-way analysis of variance
    • Friedman test
    • Jonckheere's trend test
Suy luận Bayes
Hệ số tương quan
  • Pearson correlation coefficient
  • Partial correlation
  • Confounding
  • Coefficient of determination
Phân tích hồi quy
  • Errors and residuals
  • Regression validation
  • Mixed model
  • Simultaneous equations models
  • Multivariate adaptive regression spline
Hồi quy tuyến tính
  • Simple linear regression
  • Ordinary least squares
  • General linear model
  • Bayesian linear regression
Non-standard predictors
Generalized linear model
  • Exponential family
  • Logistic regression / Binomial regression / Poisson regressions
Partition of sums of squares
  • Analysis of variance
  • Analysis of covariance
  • Multivariate analysis of variance
  • Degrees of freedom (statistics)
Categorical variable / Multivariate statistics / Chuỗi thời gian / Survival analysis
Categorical variable
Multivariate statistics
Chuỗi thời gian
General
  • Decomposition of time series
  • Linear trend estimation
  • Stationary process
  • Seasonal adjustment
  • Exponential smoothing
  • Cointegration
  • Structural break
  • Granger causality
Specific tests
Time domain
  • Autocorrelation
    • Partial autocorrelation function
  • Cross-correlation
  • Arma
  • Box–Jenkins method
  • ARCH
  • Vector autoregression
Frequency domain
Survival analysis
Survival function
  • Kaplan–Meier estimator
  • Proportional hazards models
  • Accelerated failure time model
  • First-hitting-time model
Failure rate
  • Nelson–Aalen estimator
Test
  • Logrank test
List of fields of application of statistics
Biostatistics
Engineering statistics
  • Chemometrics
  • Methods engineering
  • Probabilistic design
  • Statistical process control / Kiểm soát chất lượng
  • Reliability engineering
  • System identification
Social statistics
Spatial analysis
  • Thể loại[[::Thể loại:Thống kê]]
  • '
  • Trang CommonsCommons:Category:Statistics
  • Dự án Wiki Wikipedia:WikiProject Statistics
  • Cổng thông tin Toán học
Tiêu đề chuẩn Sửa dữ liệu tại Wikidata
  • GND: 4143009-8
  • NKC: ph420381