作者:Sting

软件架构的定义、描述及7项技能

摘要:软件架构师就是这么一个让人向往,但又让人望洋兴叹的一个职位。 前言 就像建筑设计师总有成为总设计师的梦想,航天工作者总有成为总工程师的壮志,相信每一个软件工程师都有过成为软件架构师的想法。 引用维基百科里的定义,软件架构师的职责就是在软件系统研发中,负责依据需求来确定主要的技术选择、设计系统的……

725个机器学习术语表

这是几位机器学习权威专家汇总的725个机器学习术语表,非常全面,值得收藏! 英文术语 中文翻译 0-1 Loss Function 0-1损失函数 Accept-Reject Sampling Method 接受-拒绝抽样法/接受-拒绝采样法 Accumulated Error Backpropagation 累积误差反向传播 Accuracy 精度 Acquisition Function 采集函数 Ac……

OO,OOA,OOD,OOP和DDD

OO:Object-Oriented,面向对象,基于对象概念,以对象为中心,以类和继承为构造机制,来认识理解,刻画客观世界和设计; OOA:Object-oriented Analysis 面向对象分析,进一步对OO进行细化,初步得到OO的方法; OOD:Object-Oriented Design,面向对象设计,OO方法中一个中间过渡环节,对OOA分析的结果进行进一步规范和……

Hive优化

1. 概述 1.1 hive的特征: 可以通过SQL轻松访问数据的工具,从而实现数据仓库任务,如提取/转换/加载(ETL),报告和数据分析; 它可以使已经存储的数据结构化; 可以直接访问存储在Apache HDFS或其他数据存储系统(如Apache HBase)中的文件; Hive除了支持MapReduce计算引擎,还支持Spark和Tez这两种分布式计算引擎; ……

Apache Flink 是什么?

Apache Flink 是一个框架和分布式处理引擎,用于在无边界和有边界 数据流上进行有状态的计算。Flink 能在所有常见集群环境中运行,并能以内存速度和任意规模进行计算。 接下来,我们来介绍一下 Flink 架构中的重要方面。 处理无界和有界数据 任何类型的数据都可以形成一种事件流。信用卡交易、传感器测量、机器日志、网站……

4 data tagging best practices

The more data you can apply to a business problem, the better its potential solutions. While there’s no shortage of data available to your enterprise today, it’s often difficult to know what data you have and how it can be used. This is why you should never overlook the important role metadata pla……