About Array String and Regex

“To be is to be perceived. ”

1. 数组方法

1.1. 改变原数组的

shift：将第一个元素删除并且返回删除元素，空即为undefined
unshift：向数组开头添加元素，并返回新的长度
pop：删除最后一个并返回删除的元素
push：向数组末尾添加元素，并返回新的长度
reverse：颠倒数组顺序
sort：对数组排序
splice:splice(start,length,item)删，增，替换数组元素，返回被删除数组，无删除则不返回

1.2. 不改变原数组的：

concat：连接多个数组，返回新的数组
join：将数组中所有元素以参数作为分隔符放入一个字符
slice：slice(start,end)，返回选定元素
map,filter,forEach,some,every等不改变原数组

1.3. 必知的数组方法

Array.forEach()

能够方便的遍历数组里的每个元素，可以在回调函数里对每个元素进行操作该方法没有返回值，不需要在回调函数里写return，这是无意义的
```
  //forEach
  var animals = ['dog', 'cat', 'mouse'];
  animals.forEach(function(item){
      console.log(item);
  });
```
Array.map()

如果你想修改数组里的每个元素，然后将修改后的数组存入新的数组，那使用 .map() 方法最方便。

.map() 方法能够遍历整个数组，然后返回一个新数组，这个新数组里的元素是经过了指定的回调函数处理过的
```
  //map
  var numbers = [2, 4, 6, 8];
  var doubleNums = numbers.map(function(element) {
      return element * 2;
  });

  console.log('doubleNums: ', doubleNums)  //[4, 8, 12, 16]
```

Array.filter()

.filter() 方法能够过滤掉数组中的某些元素，可以在回调函数里设定条件，不符合条件的元素都会排除在外

  var scores = [3, 12, 5, 23, 19, 7];

  var topScores = scores.filter(function(item){
      if (item > 10){
          return true;
      } else {
          return false;
      }
  });

  console.log('topScores: ', topScores);   // [12, 23, 19]

Array.indexOf()

indexOf() 能够告诉你某个元素在数组中的位置，它返回的是索引值，如果数组里有重复的元素，它会返回第一个元素的位置

  var a = [2, 9, 9, 18];

  var i = a.indexOf(9);

  console.log('i: ', i);

  /*
  if (a.indexOf(7) === -1) {
  // 数组中没有这个元素
  }*/

Array.every()

如果你想知道数组中的所有元素都是否符合某种条件，使用 .every() 最方便

.every() 方法的作用是用指定的回调函数去检查数组中的每个元素，如果对于每个元素，这个回调函数都返回true，则.every()返回true。否则，.every() 返回false
```
  var ages = [23, 19, 32, 44];

  var olderThan18 = ages.every(function(element) {
      return element > 18;
  });

  console.log('olderThan18: ', olderThan18);   // olderThan18:  true
```

参考：

2. 字符串

属性 length

2.1. 对象通用方法

String类型是与字符串对应的包装类型，继承了Object对象的通用方法作用：返回string 的原始字符串值

toString()
toLocaleString()
valueOf()

2.2. 访问字符

chartAt()

charAt()方法涉及到Number()函数的隐式类型转换，如果转换为数值，则按照上述规则输出字符串；如果转换为NaN，则输出第0个字符
中括号[]

参数超出范围或是NaN时，则输出undefined；没有参数时，会报错；该方法没有Number()转型函数的隐式类型转换，但参数为单数值数组时可转换为数值
```
  var str = "hello";
  console.log(str[0]);//h
  console.log(str[[1]]);//e
  console.log(str[false]);//undefined
```

charCodeAt()

类似 charAt 指定位置的字符16位Unicode编码。返回值是一个16位的整数

  var str = "hello";
  console.log(str.charCodeAt());//104
  console.log(str.charCodeAt(0));//104

fromCharCode()

接收一个或多个字符编码，然后把它们转换成一个字符串

  console.log(String.fromCharCode(104,101,108,108,111));//'hello'
  console.log(String.fromCharCode(0x6211,0x662f,0x5c0f,0x706b,0x67f4));//'我是小火柴'

2.3. 查找

同访问字符方法charAt()和中括号[]方法有相反的地方一个通过字符串查找位置一个则是通过位置查找字符

indexOf(searchString,start)
- 返回searchString首次出现的位置，如果没有找到则返回-1
- 隐式调用String()转型函数，将searchString非字符串值转换为字符串
lastIndexOf(searchString,start)
- 返回searchString第一次出现的位置，如果没有找到则返回-1
- 从右向左查找

2.4. 字符串拼接

concat()
- 将一个或多个字符串拼接起来，返回拼接得到的新字符串，而原字符串不发生改变。
- 若参数(第一个参数除外)不是字符串，则通过String()方法隐式转换为字符串，再进行字符串拼接
```
  var stringValue = 'hello ';
  var result = stringValue.concat('world','!');
  console.log(result);//'hello world!'
  console.log(stringValue);//'hello'
```
  第一个参数只能是字符串，如果是其他类型(数组除外)则报错
  
  参数会按照首先出现的参数是数组还是字符串来决定如何转换
加号+

当操作数其中一个是字符串，或者对象转换为字符串时，才进行字符串拼接

2.5. 创建子字符串

slice(start,end)

返回子串为负数时从后往前数
substring(start,end)
- 如果任一参数是NaN或负数，则被0取代
- 如果任一参数大于字符串长度，则被字符串长度取代
- 如果start 大于 end，则交换它们的值
substr(start,length)
- start和end无法交换位置
- [注意]该方法不是ECMAScript标准，已经被弃用

2.6. 大小写转换

toLowerCase()
toLocaleLowerCase()

(针对地区)
toUpperCase()
toLocaleUpperCase()

(针对地区)

[注意]在不知道自己的代码将在哪个语言环境中运行的情况下，使用针对地区的方法更稳妥

这4种方法均不支持String()隐式类型转换，只支持字符串类型

(true).toLowerCase();//报错
(2).toLocaleLowerCase();//报错
({}).toUpperCase();//报错
([]).toLocaleUpperCase();//报错

2.7. 匹配方法

match()

只接受一个为正则或字符串的参数，并以数组的形式返回匹配的内容
若不设置全局标志，match()方法和exec()方法结果相同
若不设置全局标志，具有index和input属性

  var str = 'ere333',
      reg = /e/,
      regg = /e/g

  reg.exec(str)  //['e']
  str.match(reg) //['e']
  str.match(regg) //['e','e']

  str.match(reg).index // 0
  str.match(reg).input //'ere333'

search()
- 返回匹配的内容在字符串中首次出现的位置
  
  类似于不能设置起始位置的indexOf，找不到返回-1
- search()方法不执行全局匹配，忽略全局标志g
- 也会忽略RegExp对象的lastIndex属性，总是从字符串的开始位置开始搜索

replace()

替换一个或多个子字符串
接收两个参数：第一个是正则表达式或字符串，表示待查找的内容；第二个是字符串或函数，表示替换内容
返回替换后的字符串

短属性名说明

$& 最近一次的匹配项
$` 匹配项之前的文本
$’ 匹配项之后的文本
$1,$2… 表示第N个匹配捕获组

  var string = 'cat-bat-sat-fat';
  console.log(string.replace(/(.)(at)/g,'$&'));//'cat-bat-sat-fat'
  console.log(string.replace(/(.)(at)/g,'$`'));//'-cat--cat-bat--cat-bat-sat-'
  console.log(string.replace(/(.)(at)/g,"$'"));//'-bat-sat-fat--sat-fat--fat-'
  console.log(string.replace(/(.)(at)/g,'$1'));//'c-b-s-f'
  console.log(string.replace(/(.)(at)/g,'$2'));//'at-at-at-at'

replace() 方法的第二个参数可以是函数

函数的参数：

匹配到的字符串
正则的分组内容，如果没有分组就没有这个参数（如果有多个分组，就有多个对应的参数）
匹配的字符串的 index
原字符串

  // 首字母大写
  var text = 'one two three';
  var result = text.replace(/\b(\w+)\b/g,function(match,m1,pos,originalText){
      return m1.charAt(0).toUpperCase()+m1.substring(1); 
  })
  console.log(result);

  // HTML 转义
  function htmlEscape(text){
      return text.replace(/[<>"&]/g,function(match,pos,originalText){
          switch(match){
              case '<':
              return '&lt;';
              case '>':
              return '&gt;';
              case '&':
              return '&amp;';
              case '\"':
              return '&quot;';
          }
      });
  }
  console.log(htmlEscape('<p class=\"greeting\">Hello world!</p>'));
  //&lt;p class=&quot; greeting&quot;&gt;Hello world!&lt;/p&gt;
  console.log(htmlEscape('<p class="greeting">Hello world!</p>'));
  //同上

  // 找出重复项最多的字符和个数
  var str = 'aaaaabbbbbdddddaaaaaaaffffffffffffffffffgggggcccccce';
  var pattern = /(\w)\1+/g;
  var maxLength = 0;
  var maxValue = '';
  var result = str.replace(pattern,function(match,match1,pos,originalText){
      if(match.length > maxLength){
          maxLength = match.length;
          maxValue = match1;
      }
  })
  console.log(maxLength,maxValue);//18 "f"

split()
- 基于指定的分隔符将一个字符串分割成多个字符串，并将结果放在一个数组中，分隔符可以是字符串，也可以是一个RegExp
- 可以接受第二个参数(可选)用于指定数组的大小
  
  如果第二个参数为0-array.length范围内的值时按照指定参数输出，其他情况将所有结果都输出

2.8. 去除首尾空格

trim()

创建一个字符串的副本，删除前置及后缀的所有空白字符，然后返回结果

  // 判断输入字符是否为空
  if(usename.trim().length){
      alert('correct');
  }else{
      alert('error');
  }

2.9. 字符串比较

localeCompare()
- 如果字符串在字母表中应该排在字符串参数之前，则返回一个负数(大多数情况下为-1)
- 如果字符串等于字符串参数，则返回0
- 如果字符串在字母表中应该排在字符串参数之后，则返回一个正数(大多数情况下为1)

3. 正则

书写方式

构造器

var regex = /\w+/

字面量

  var regex = new RegExp('\\w+')

  // '\' 需要转义 ---> \\

正则对象方法

—test(String)

测试字符串中是否有符合正则表达式规则的文本

lastIndex: 当前表达式匹配内容的最后一个字符的下一个位置

const regE = /\d/
const regF = /\d/g

regE.test('1') // true
regE.test('a23') // true

regF.test('12') // true
regF.test('12') // true
regF.test('12') // false

当第一次匹配时，匹配的字符是1，此时lastIndex=1，下一次匹配时就会从 index 为 1 的字符开始匹配（起始未0）第二次匹配时，匹配字符是2，此时lastIndex=2 第三次匹配时，由于 index=2 的位置上没有字符，匹配不到数字，就会返回 false 了

—exec(String)

使用正则的规则对字符串进行搜索，如果有匹配的文本则返回结果数组，没有则返回 null

const regG = /\d/
const regH = /\d/g

regG.exec('12') // ["1", index: 0, input: "12"]
regG.exec('12') // ["1", index: 0, input: "12"]

regH.exec('12') // ["1", index: 0, input: "12"]
regH.exec('12') // ["2", index: 1, input: "12"]
regH.exec('12') // null
// 返回的数组中 index 属性为当前匹配到的字符的初始位置

修饰符

g

global 全文搜索，添加这个修饰符将会匹配文本中所有可以匹配的字符
i

ignore case 忽略大小写，添加以后将会同时匹配大写和小写
m

multiple lines 多行匹配，当文本中有换行符时，通过这个修饰符可以匹配到下面几行的内容

const regC = /\d/g
const regD = new RegExp('\d', 'g')

// 如果要同时使用多个修饰符的话，可以将修饰符连写，像这样 /\d/gim

原意文本字符和元字符

元字符

在正则表达式中含有特殊含义的非字母字符

. * + ? $ ^ | \ ( ) { } [ ]

字符类

在正则中的一个字符对应着字符串中的一个字符字符类：一类具有某种特征的字符

  [abc] // [abc] 为一个整体，只对应字符串中的一个字符 a || b || c

  // 取反： 中括号内的最前面添加 ^ 
  [^abc] // 不匹配 a 或 b 或 c

范围类

  [0-9] // 匹配数字
  [a-z] // 匹配小写英文字母
  [a-zA-Z] // 匹配所有英文字母

  // -本身并不是特殊字符，只有在两个文本字符之间时才能有表示范围的作用

预定义类

  . => [^\r\n] // 除回车和换行符之外的所有字符
  \d => [0-9] // 所有数字
  \D => [^0-9] // 所有非数字
  \s => [\t\nx0B\f\r] // 空白符
  \S => [^\t\nx0B\f\r] // 非空白符
  \w => [a-zA-Z_0-9] // 单词字符（字母数字下划线）
  \W => [^a-zA-Z_0-9] // 非单词字符

  //  边界匹配
  ^ // 以xxx开始 (在中括号中表示取反)
  $ // 以xxx结束
  \b // 单词边界
  \B // 非单词边界

  //举例说明：

  ^ac\d
  // 匹配以 a 开头，第二个字符为 c，第三个字符为数字的字符串，如 ac0 ac1r ac2fds 的前3个字符将会被匹配
  // bc0d ba13fsd b0adas 等将不会被匹配

  \di9$
  // 匹配以 9 结尾，倒数第二个字符为 i，倒数第三个字符为数字的字符串，如 das0i9 12i9 r324i9 的最后3个字符将会被匹配

  \bf\dk\b
  // 只匹配以 f 开头 k 结尾 中间是数字的三位字符串 f0k f1k f2k
  // af1k f1k3 f9i 等将不会被匹配

  \bf\dk\B
  // 只匹配以 f 开头，中间是数字，第三位是 k 且 k 不是结尾的字符串 f0k1 f0kkk f2k22
  // f0k f1k f2k fkk fkf fkk0 等将不会被匹配

量词

\d\d\d\d\d\d\d\d\d\d —> \d{10}

? // 最多出现一次 a?
+ // 最少出现一次 a+
* // 出现任意次 a*
{n} // 出现 n 次 a{3}
{n,m} // 出现 n 到 m 次 a{1,3}
{n,} // 至少出现 n 次 a{2,}
// 不存在 {,m} 的写法，它等同于 {0,m}

贪婪模式与非贪婪模式

  \d{3,6} 
  // 正则在匹配的时候回尽可能多的匹配，所以上面的这个正则只会匹配到123456，78将不会被匹配

  \d{3,6}?
  // 0123456789 这个字符串将会被匹配到 012 345 678

分组

当有一个单子需要被重复5次时，我们会这样写word{5}，但是这个正则对应的字符串应该是worddddd，量词只会将它紧邻的字符重复

(word){5}
// wordwordwordwordword
// 通过()我们可以达到分组的目的

或

需要表示 word 或 number 这两个英文单词时，可以通过 | 来表示

(word)|(number)
// word
// number
// 需要注意的是不能写成 word|number 否则会匹配 wordumber 或者 wornumber

引用

正则中被分组的字符，我们可以按顺序通过 $1 $2 $3 ... 来捕获，如果需要引用原字符串的内容，只需要引用对应的 $1 $2 $3 ... 即可

var dt = '2017-10-14'

var reg = /(\d{4})-(\d{2})-(\d{2})/
console.log(dt.replace(reg, "$3-$2-$1")) // 14-10-2017

如果分组后不想捕获，可以忽略分组，只需要在分组内加上 ?: 即可

// 中间的第二个分组将会被忽略，原先的 $2 现在会获取到原先 $3 对应的值

var dt = '2017-10-14'
var reg = /(\d{4})-(?:\d{2})-(\d{2})/
console.log(dt.replace(reg, "$3-$2-$1")) // $3-14-2017

前瞻后顾

正则在匹配到规则的时候，向前检查是否符合断言叫前瞻，向后检查则叫后顾

learn from blogs