Weighting and selection of variables for cluster analysis   总被引:1,自引:0,他引:1  
One of the thorniest aspects of cluster analysis continues to be the weighting and selection of variables. This paper reports on the performance of nine methods on eight leading case simulated and real sets of data. The results demonstrate shortcomings of weighting based on the standard deviation or range as well as other more complex schemes in the literature. Weighting schemes based upon carefully chosen estimates of within-cluster and between-cluster variability are generally more effective. These estimates do not require knowledge of the cluster structure. Additional research is essential: worry-free approaches do not yet exist.  相似文献   

For classifying a univariate or a multivariate observation in one of the two populations, Tiku and Balakrishnan (1984) and Balakrishnan, Tiku and Shaarawi (1985) developed robust (to departures from normality) procedures. These procedures are extended here to situations where the classification has to be based on the observed value of a pair of variables, one being a dichotomous random variable and the other a univariate or a multivariate continuous random variable.We are very grateful to the referees for their comments which led to a substantial improvement of an earlier draft of this paper. Thanks are also due to the Natural Sciences and Engineering Council of Canada for a research grant to M.L. Tiku.  相似文献   

The location model is a useful tool in parametric analysis of mixed continuous and categorical variables. In this model, the continuous variables are assumed to follow different multivariate normal distributions for each possible combination of categorical variable values. Using this model, a distance between two populations involving mixed variables can be defined. To date, however, no distributional results have been available, against which to assess the outcomes of practical applications of this distance. The null distribution of estimated distance is therefore considered in this paper, for a range of possible situations. No explicit analytical expressions are derived for this distribution, but easily implementable Monte Carlo schemes are described. These are then applied to previously cited examples.  相似文献   

An approach is presented for analyzing a heterogeneous set of categorical variables assumed to form a limited number of homogeneous subsets. The variables generate a particular set of proximities between the objects in the data matrix, and the objective of the analysis is to represent the objects in lowdimensional Euclidean spaces, where the distances approximate these proximities. A least squares loss function is minimized that involves three major components: a) the partitioning of the heterogeneous variables into homogeneous subsets; b) the optimal quantification of the categories of the variables, and c) the representation of the objects through multiple multidimensional scaling tasks performed simultaneously. An important aspect from an algorithmic point of view is in the use of majorization. The use of the procedure is demonstrated by a typical example of possible application, i.e., the analysis of categorical data obtained in a free-sort task. The results of points of view analysis are contrasted with a standard homogeneity analysis, and the stability is studied through a Jackknife analysis.  相似文献   

虚拟管理是伴随网络经济发展而兴起的一种管理理念。由于虚拟现实技术在管理中的运用,提高了企业的生产经营效率,大大降低交易成本,同时也对现代组织的人力资源管理方式产生了巨大影响。现代组织对智力载体(人)的管理出现了新的趋势——人力资源虚拟管理。本文以人力资源管理理念变革为历史背景,阐述了人力资源虚拟管理的实质和特点,探讨了人力资源虚拟管理的模式选择问题。  相似文献   

The variation and selection form of explanationcan be prescinded from the evolutionary biologyhome ground in which it was discovered and forwhich it has been most developed. When this isdone, variation and selection explanations arefound to have potential application to a widerange of phenomena, far beyond the classicalbiological ground and the contemporaryextensions into epistemological domains. Itappears as the form of explanation most suitedto phenomena of fit. It is also found toparticipate in multiple interestingrelationships with other forms of explanation. We proceed with an examination of multiplekinds of phenomena, interrelationships withother members of the family of forms ofexplanation, and some novel applications evenwithin the home ground of evolutionary biology.  相似文献   

新版《中国人民解放军军语》作为鲜明反映时代特点和我军改革建设创新发展的重要军事术语集,必须跟上时代发展、跟上斗争实践、跟上改革步伐、跟上法治进程,把习近平强军思想内容作为首要选词对象,把备战打仗的相关用语作为主要选词对象,把深化国防和军队改革成果作为基本选词对象,把新的军事法规制度表述作为常用选词对象。在选词定词过程中,应遵循时代性、系统性、专业性、实用性、稳定性等原则,注意正确选取资料、科学遴选词目、认真归纳整理,以构建完善具有时代特点和我军特色的军语体系。  相似文献   

编订名词馆是清末学部负责统一各学科名词的机构。在数学名词方面,该馆统一了算学、代数、形学、平三角、弧三角、解析形学等类名词约1000个,将其编订为《数学中英名词对照表》。编订名词馆统一数学名词的活动开创了中国官方统一数学名词的先河,这一活动所遵循的原则是:有选择地采用旧译词;常发掘雅驯的古字来另译新名;基本不直接采用日译词。尽管由于日译词涌入并流行以及白话文普及对文言文的冲击等原因,具有严译风格的雅驯译词后来被淘汰,但《数学中英名词对照表》中“仍从旧译”的大部分数学名词留存至今,对后来中国的数学传播起到积极作用。  相似文献   

麻黄碱(麻黄素)是20世纪20年代开始中国中药科学化研究的最重要的药物之一.但早期研究均以外文发表,由于译者的不同,ephedrine一 词在中文翻译过程中,先后出现了多种音译名和意译名.虽经过长期使用和两次官方的译名审定,至今“麻黄碱”“麻黄素”两个中文译名仍然并存.ephedrine一词中文译名的变化,反映了不同的译者群体对科技名词本土化的不同作用与影响.  相似文献   

创意产业兴起的条件及其思考   总被引:1,自引:0,他引:1  
根据创意产业的内涵分析了创意产业能够兴起的三个条件:尊重创意的价值观确立;知识产权保护为基础的市场交易制度的完善;科技提供的需求前提、手段、效率机制。然后从STS视角探讨了对创意与新经济时代的关系,文化对科技的影响,以及受到知识产权保护的文化创意产业化、商业化所带来的问题。  相似文献   

简要分析了德、俄等语种按专业建立双语术语库的迫切性与可行性;指出专业工具书的短缺和滞后,严重制约了这些语种科技翻译总体水平的提高;呼吁尽快按专业建立股份合作式的商业性双语术语库,以便直接和国际先进翻译模式接轨。  相似文献   

论述了传教士组织益智书会与中国学者杜亚泉的中文无机物命名方案及其异同,指出:两套方案都以确定物质的属名及一套定性词头为主要特征;两者都尽量利用中国传统物质名词来制定属名,出发点虽然良好,但未能准确反映出西方无机物命名的分类思想;前者所确定的词头与西方化学名词的定性词缀相对应,沿袭了西方名词本身存在的混乱和弊病,无法传递出关于化合物组成的准确信息;后者确定了一套与元素化合价严格对应的词头,通过掌握元素周期表等基本化学知识就能由名及物,可以间接反映出化合物的组成。在此基础之上,进一步讨论了类属式命名方案的影响及未得到流传的原因。  相似文献   

岳麓书院藏秦简<数>里保存了一些与体积重量换算有关的内容,经过初步分析,可以认为:周秦时期人们计量谷物时习惯用体积测算法,并且测出多种谷物的体积重量比值记录在算术书里;当时人们有可能利用水作为体积重量换算中的标准常量,也可能在生活实践中应用了"比重"的观念.  相似文献   

技术价值评价是技术价值观的基本问题,对此问题的阐释直接关涉到对技术本质观、技术发展观和技术伦理等一系列问题,因此,技术价值评价的原则和尺度是技术哲学研究不可回避的重要问题之一。技术价值评价原则和尺度的分歧决定着对技术价值的理解与认知的差异。在马克思的历史唯物主义理论视域中,生存论的原则以及历史的和人性的尺度才是技术价值评价的根本原则和尺度。  相似文献   

1956年,杨振宁、李政道为解开"θ-τ之谜"提出了质疑宇称守恒在弱相互作用中是否成立的科学假说,吴健雄率先验证了在弱相互作用中宇称不守恒。但在获得实验结果后,她却缺乏"抢先发表"成果的意识,有意延缓成果发表,导致另两个实验小组后来赶上。而首先发表是科学发现优先权归属所依据的准则,依据这一准则,吴健雄丧失了独占实验发现的优先权,从而丧失了分享诺贝尔物理学奖这一殊荣的良机。这一诺贝尔奖案例给我们的启示是,在激烈的全球科学竞技场上,科研人员应当具备科学成果抢先发表的意识。  相似文献   

随着国家发展进入新时代,如何在工程领域培养一批又一批具备能够满足人民日益增长的美好生活需要的价值观和技能的人才,则成为解决新的主要社会矛盾的关键。在技能和价值观二者之中,价值观的教育和养成更为重要,难度更大。学界正在推行通识教育,力图通过通识教育培养工科学生对"真、善、美"的鉴赏力和理想追求。然而,由于通识教育目标不明确等诸多因素,工科的通识教育效果尚不理想,出现了通识教育与专业教育脱节的现象。为此,我们在化学工程教育中开设了具有中国特色的《化学工程伦理》研究生必修课程,试图将它作为专业教育和通识教育之间的桥梁,期望能为培养适应新时代要求、具有全球胜任力和竞争力的一流工程人才探索一条新路径。  相似文献   

技术手段并不能消除自身产生的社会后果,需要进行社会性建构。本文在考察当今社会如何回应“数字化生存”的挑战问题时,提出了一个生活方式分析框架,认为生活方式在解决数字化高科技可能给人们的生存方式带来的意义缺失、“生活风险”等负面影响时,具有重要的建构功能。  相似文献   

本文介绍了日本、澳大利亚和韩国政府吸引海外优秀研究人员的政策措施,并重点介绍了这3个国家具体资助科学研究的机构如日本学术振兴会、澳大利亚研究理事会、韩国科学与工程基金会吸引海外研究人员的项目类别和具体做法,其成功的经验对我国制定吸引海外人才的政策措施和计划有重要的启示和借鉴意义。  相似文献   

《大衍历》日躔表的数学结构及其内插法   总被引:1,自引:1,他引:0  
《大衍历》日躔表是一份四次差分相等的数表,反映一行对太阳运动复杂性的深刻认识。一行调整插值引数为不等间距型,并认为具有降阶作用,因而能够采用二次函数完成四次差分表的插值计算。但一行对插值间距只利用差分方程作了第一次逼近,没有进行迭代计算,从而影响了计算精度。  相似文献   

